Искусственный интеллект обычно рассматривается как инструмент, помогающий предприятиям продвигаться в условиях современной цифровой экономики. Но возможности применения ИИ настолько широки, что его нельзя свести к уловке с целью получения капитала. Фактически, некоторые стремятся использовать ИИ и машинное обучение, чтобы найти решения для улучшения общества.

Во время ODSC East 2019 Крис Мак, вице-президент по аналитике текста в Basis Technologies представил различные ситуации, в которых обработка естественного языка может быть использована навсегда. Мак начал свое выступление с подробного описания заговора о предотвращении трансатлантической жидкой бомбы в 2006 году. Американская и британская разведка смогла обнаружить планы бомбардировки с помощью технологий искусственного интеллекта.

[Статья по теме: Введение в языковую обработку с помощью NLTK]

К сожалению, не все ситуации, подобные заговору с жидкой бомбой, таковы. Тем не менее, Мак говорит, что мы можем использовать эту героическую тактику как план, чтобы помочь предотвратить другие террористические атаки и преступления, которые не останутся незамеченными.

Согласно исследованию, которое Мак процитировал в своей презентации, террористические действия унесли жизни чуть более 11000 мирных жителей только в Европе с 1979 по 2017 год. Мак также сказал, что только один процент всех незаконных средств и операций по отмыванию денег регулярно конфискуется правоохранительными органами. .

Итак, как мы можем сделать ИИ лучшим инструментом для предотвращения террористических атак и синдицированной преступности? Мак говорит, что необходимо уделять больше внимания использованию обработки естественного языка в исследованиях. Кроме того, эта технология должна постоянно внедрять инновации и обрабатывать случаи, которые можно легко направить.

Например, когда данные подвергаются обработке на естественном языке, данные обычно оцениваются с использованием ключевых слов и простых правил. Иногда язык, используемый для передачи потенциальных атак, имеет гораздо больше нюансов, чем эти правила пытаются найти, и может привести модели к обнаружению ложных срабатываний или отрицаний.

«С этими системами, основанными на правилах, невозможно правильно обработать каждое слово на языке, поэтому это хорошая отправная точка, но вы столкнетесь с некоторыми проблемами», - сказал Мак.

В большинстве моделей также не учитываются варианты данных, такие как разное написание имен или слов с разными корнями. Это может привести к появлению зашумленных данных, которые также могут иметь флаги, которые модель машинного обучения может пропустить. Мак предлагает кросс-языковую семантическую модель, которая может обрабатывать эти случаи, как если бы вы работали на одном языке.

[Статья по теме: Искусственный интеллект и машинное обучение на практике: обнаружение аномалий в данных ERP армии]

«Мы создали кросс-языковые вложения и вложения для конкретных областей, которые позволяют нам сказать:« Это не только одна и та же тема, но и одна и та же тема на двух разных языках », - сказал Мак.

Поскольку обработка естественного языка быстро развивается, международным правоохранительным органам потребуется некоторое время, чтобы довериться этой технологии. Однако, если есть что-то, что мы можем узнать из заговора с жидкой бомбой, так это то, что своевременное обнаружение атаки должно быть приоритетом, а ИИ может быть будущим разведки.

Оригинальный пост здесь.

Прочтите больше статей по науке о данных на OpenDataScience.com, включая учебные пособия и руководства от новичка до продвинутого уровня! Подпишитесь на нашу еженедельную рассылку здесь и получайте последние новости каждый четверг.