Искусственный интеллект обычно рассматривается как инструмент, помогающий предприятиям продвигаться в условиях современной цифровой экономики. Но возможности применения ИИ настолько широки, что его нельзя свести к уловке с целью получения капитала. Фактически, некоторые стремятся использовать ИИ и машинное обучение, чтобы найти решения для улучшения общества.
Во время ODSC East 2019 Крис Мак, вице-президент по аналитике текста в Basis Technologies представил различные ситуации, в которых обработка естественного языка может быть использована навсегда. Мак начал свое выступление с подробного описания заговора о предотвращении трансатлантической жидкой бомбы в 2006 году. Американская и британская разведка смогла обнаружить планы бомбардировки с помощью технологий искусственного интеллекта.
[Статья по теме: Введение в языковую обработку с помощью NLTK]
К сожалению, не все ситуации, подобные заговору с жидкой бомбой, таковы. Тем не менее, Мак говорит, что мы можем использовать эту героическую тактику как план, чтобы помочь предотвратить другие террористические атаки и преступления, которые не останутся незамеченными.
Согласно исследованию, которое Мак процитировал в своей презентации, террористические действия унесли жизни чуть более 11000 мирных жителей только в Европе с 1979 по 2017 год. Мак также сказал, что только один процент всех незаконных средств и операций по отмыванию денег регулярно конфискуется правоохранительными органами. .
Итак, как мы можем сделать ИИ лучшим инструментом для предотвращения террористических атак и синдицированной преступности? Мак говорит, что необходимо уделять больше внимания использованию обработки естественного языка в исследованиях. Кроме того, эта технология должна постоянно внедрять инновации и обрабатывать случаи, которые можно легко направить.
Например, когда данные подвергаются обработке на естественном языке, данные обычно оцениваются с использованием ключевых слов и простых правил. Иногда язык, используемый для передачи потенциальных атак, имеет гораздо больше нюансов, чем эти правила пытаются найти, и может привести модели к обнаружению ложных срабатываний или отрицаний.
«С этими системами, основанными на правилах, невозможно правильно обработать каждое слово на языке, поэтому это хорошая отправная точка, но вы столкнетесь с некоторыми проблемами», - сказал Мак.
В большинстве моделей также не учитываются варианты данных, такие как разное написание имен или слов с разными корнями. Это может привести к появлению зашумленных данных, которые также могут иметь флаги, которые модель машинного обучения может пропустить. Мак предлагает кросс-языковую семантическую модель, которая может обрабатывать эти случаи, как если бы вы работали на одном языке.
«Мы создали кросс-языковые вложения и вложения для конкретных областей, которые позволяют нам сказать:« Это не только одна и та же тема, но и одна и та же тема на двух разных языках », - сказал Мак.
Поскольку обработка естественного языка быстро развивается, международным правоохранительным органам потребуется некоторое время, чтобы довериться этой технологии. Однако, если есть что-то, что мы можем узнать из заговора с жидкой бомбой, так это то, что своевременное обнаружение атаки должно быть приоритетом, а ИИ может быть будущим разведки.
Прочтите больше статей по науке о данных на OpenDataScience.com, включая учебные пособия и руководства от новичка до продвинутого уровня! Подпишитесь на нашу еженедельную рассылку здесь и получайте последние новости каждый четверг.