Машинное обучение для обеспечения физической безопасности — интервью с специалистом по данным Stabilitas доктором Михаилом Зайдманом
Главный операционный директор Стабилитас Крис Херст недавно взял интервью у ведущего специалиста по данным команды доктора Зайдмана.
Биография доктора Задимана ниже.
Цель интервью: Введение в машинное обучение для специалистов по безопасности.
Мы надеемся, что это интервью поможет менеджерам по безопасности, аналитикам, командам разработчиков программ и другим людям понять, как работает машинное обучение (ML). После того, как Марк Кьюбан подробно рассказал об искусственном интеллекте на конференции ASIS в этом году в Далласе (и после того, как многие глаза затуманились!) мы делимся своим мнением о том, как машинное обучение может улучшить жизнь специалистов по безопасности.
Крис Херст: Михаил, во-первых, что вас привлекло в сфере безопасности?
Михаил Зайдман: Пространство безопасности интересно тем, что оно принципиально глобально. Вы не можете думать о безопасности, не думая о глобальных силах. Это создает множество интересных задач и множество интересных возможностей для понимания тенденций данных и решения сложных вопросов, связанных с данными.
Например, как получить информацию, невзирая на язык, границы и типы данных? С точки зрения науки о данных и политики это пространство для размышлений над большими вопросами, и это интересно.
Наука о данных для безопасности также оказывает существенное влияние на реальный мир, и иногда его трудно оценить. То, что предотвращено, не обязательно является хорошей метрикой, потому что то, что не происходит, трудно измерить. Но измерить неизмеримое и сделать необнаружимое обнаруживаемым — крутая задача.
CH: Не могли бы вы привести конкретный пример того, как машинное обучение помогает менеджерам по безопасности? Завершите предложение: «В мире до ML менеджер по безопасности боролся, потому что ___. Но в мире машинного обучения его или ее жизнь отличается, потому что ___».
МЗ: В современном мире менеджер по безопасности смотрит 24 часа CNN и получает головную боль. В мире машинного обучения менеджер по безопасности видит всего три минуты полезного контента и может продолжать свой день. Они тратят свое время на упреждающий анализ и реагирование, а не на перебор огромного количества бессмысленной информации в поисках иголки в стоге сена.
CH: Есть ли конкретный пример инцидента, который, по вашему мнению, может помочь ML раскрыть этому менеджеру по безопасности?
МЗ: В идеальном случае ответ на этот вопрос – «нет»! Цель машинного обучения — раскопать каждый соответствующий инцидент — и ничего более.
Благодаря тому, как мы настроили нашу систему, у вас будет преимущество в том, что вы сможете свернуть множество похожих отчетов, так что вам не придется циклически просматривать 300 историй, скажем, о гражданских беспорядках в Каталонии. Все они будут в одном пакете, в котором вы можете копаться, если хотите.
В то время как в Каталонии происходят гражданские беспорядки, если в Израиле происходит нападение с ножом, это все еще всплывает, и ему по-прежнему придается правильная серьезность. Менеджер службы безопасности может не торопиться, чтобы просмотреть гражданские беспорядки в Каталонии, а затем углубиться в нападение с ножом в Израиле, потому что это то, что затрагивает их больше всего. Цель состоит в том, чтобы все соответствующие инциденты были доступны для использования менеджером по безопасности в режиме реального времени.
CH: Михаил, многие из наших клиентов прослужили в армии, возможно, всю свою карьеру — в полиции, ФБР, Государственном департаменте или дипломатической службе безопасности. В этих областях редко можно встретить значительное влияние ИИ. или наука о данных. Как бы вы объяснили А.И. и машинное обучение менеджеру по безопасности?
МЗ: Простой способ объяснить это так: «Вы выполняли поисковый запрос по набору данных? Вы гуглили цену билета? Вы просматривали документ и искали с помощью «control+F» интересующий вас термин?»
Все, что мы на самом деле делаем, — это предоставляем простой способ фильтрации потока данных в интересах менеджера по безопасности или аналитика. По сути, мы всего лишь одна очень причудливая функция control+F в очень большом документе. Единственная разница в том, что вместо того, чтобы управлять большим поиском разных слов и сканировать их, мы делаем все это за вас.
При разработке наших обучающих наборов данных мы гарантируем, что понимаем термины и концепции, которые вы можете искать, и применяем эти инструменты к большому потоку данных. Мы обнаруживаем те вещи, которые вы обычно ищете. Точно так же, как вы потребляете информацию сегодня, с ML информация анализируется для вас так, как вы хотели бы, чтобы она анализировалась, если бы вы делали это самостоятельно.
C: Итак, на прошлой неделе аналитик по безопасности спросил: «Стабилитас использует только ключевые слова для отправки мне предупреждений? Когда появится слово «бомба», вы пришлете мне статью — правильно?» Что бы вы ответили?
М: Нет, это неправильно, потому что, если бы мы сделали это [поиск по ключевому слову с использованием слова «бомба»], вы бы получили много статей не того типа. Может быть, вы получили бы статьи из 1990-х годов, в которых говорилось, что «этот фильм был бомбой».
Типичным примером, с которым я столкнулся, например, в своей диссертации, был поиск по ключевым словам «депрессия». Поиск по ключевому слову отправлял бы статьи об экономической депрессии — или депрессии в земле на чьем-то заднем дворе. Мне нужны были новости о депрессии, связанной с психическим здоровьем, и больше ничего.
Слова означают разные вещи в разных контекстах. Вот почему ключевых слов недостаточно для поставленной задачи. Машинное обучение учитывает контекст.
C: Итак, давайте углубимся в технологию. Над решением каких проблем вы работаете в первые несколько месяцев в Stabilitas?
М: Сейчас я сосредоточен на том, чтобы убедиться, что у нас есть организованный и структурированный способ думать обо всех наших вопросах данных и наших подходах к данным. С этой целью я потратил много сил на то, чтобы привести нас к очень четким определениям — отношения к группам безопасности и их фирмам, серьезности инцидента, типа инцидента (например, геополитический или террористический) — которые могут быть легко поняты людьми. Поэтому мы надеемся, что машины воспроизведут это человеческое понимание.
Таким образом, способность очень четко определить, какая информация является важной и как лучше классифицировать информацию, является основополагающим шагом любой работы с реальными данными. Машина не волшебная, она может только подражать тому, что ей дано. Так что, если вы не уверены, что вы даете ему, это будет делать очень плохую работу.
Примечание редактора для ясности: здесь д-р Зайдман описывает проблему, связанную с тем, что люди могут не согласиться с уместностью конкретного инцидента. Например, фирме по охране исполнительной власти, контролирующей безопасность нескольких человек, может потребоваться знать, закрыта ли конкретная улица в случае прорыва водопровода. Эта улица может быть назначенным маршрутом в больницу или на важное собрание. Между тем, группы корпоративной безопасности из трех человек, которые наблюдают за безопасностью тысяч людей, не имеют достаточной пропускной способности, чтобы продумать последствия закрытия улиц. Без консенсуса людей относительно релевантности или серьезности компьютер не может быть обучен на модели. Нам пришлось решить эту проблему, достигнув внутреннего консенсуса в нашей команде относительно релевантности.
М.З., продолжая: Как маленькому ребенку, если не дать машине четких инструкций и четких параметров, она как бы сходит с ума.
С этой целью мы разработали целый протокол — использование жестких определений, чтобы они были достаточно четкими и формальными, чтобы затем люди могли фактически предоставлять воспроизводимые обучающие данные для машины.
И затем все это ведет к основной проблеме, которую мы пытаемся решить. То есть, как вы превращаете большой объем неструктурированного человеческого текста в значимую информацию для наших клиентов?
Примечание редактора для ясности. Здесь «большой объем неструктурированного человеческого текста» широко описывается как «вся информация из открытых источников» — или, скорее, все цифровые новости и социальные сети.
МЗ, продолжая: Итак, на данный момент у нас действительно четыре измерения. Во-первых, мы должны оценить, полезна ли статья. Во-вторых, мы должны оценить, что это за статья — о войне, терроре, кризисе общественного здравоохранения и т. д. В-третьих, мы должны оценить, насколько она серьезна. В-четвертых, мы должны определить, где в мире это происходит, просто на словах.
И поэтому, будучи в состоянии четко определить, что каждая из этих вещей значит для нас, и сделав это настолько ясным, чтобы люди могли последовательно воспроизвести его, мы совершенствуем наши инструменты, чтобы отвечать на эти вопросы с помощью машин в масштабе и очень быстро.
Основываясь на нашей текущей работе, мы видим хорошую производительность с традиционными подходами машинного обучения. Мы также экспериментируем и углубляемся в глубокое обучение, где мы учим машины абстрагировать закономерности в данных, которые человек не может распознать, чтобы сделать классификацию более эффективной.
C: Давайте закончим на этом: вы однажды упомянули, что наша система похожа на экзоскелет для менеджеров по безопасности. Можете ли вы сказать, что вы имеете в виду?
М: Цель состоит в том, чтобы не менять способ, которым менеджер по безопасности или аналитик создает ценность. Менеджер по безопасности хочет иметь информацию, принимать решения на основе этой информации и обеспечивать безопасность и защищенность тех, за кого он отвечает. Мы хотим, чтобы менеджер по безопасности продолжал это делать.
Просто в нашей системе у менеджера по безопасности есть механический костюм — экзоскелет, — который позволяет ему продираться через огромные объемы данных. В отличие от того, что раньше менеджеры по безопасности могли следить за CNN и несколькими другими источниками, теперь у них есть возможность эффективно просматривать результаты тысяч онлайн-источников со всего мира на разных языках. Таким образом, раньше один человек мог заглянуть в несколько мест и принять решение, а теперь он получает информацию из тысяч источников и может принимать решения на основе этих источников за долю времени. Это намного, намного сильнее.
C: Спасибо, Михаил!
—
Для получения дополнительной информации об искусственном интеллекте, физической безопасности, управлении рисками или универсальных технологиях обнаружения инцидентов и кризисной коммуникации, пожалуйста, свяжитесь с нами по адресу [email protected] или (202) 683–7760. Или запланируйте демонстрацию на https://stabilitas.io/.
Отзывы о будущих публикациях
Что мы пропустили? На какие вопросы вы хотите увидеть ответы? Дайте нам знать по адресу [email protected].
Биография доктора Зайдмана
Доктор Зайдман имеет докторскую степень в Высшей школе Pardee RAND. В своей диссертации он применил методы машинного обучения к данным из социальных сетей, чтобы понять популярное отношение к психическому здоровью и лечению психических расстройств. Другая работа включала эконометрический анализ образовательных стандартов в области здравоохранения и интеграцию цифровых технологий в сектор здравоохранения. Он публиковался на темы национальной безопасности, полиции и правосудия. Доктор Зайдман имеет степень бакалавра в Джорджтауне и ранее работал в сфере обработки и анализа данных во Всемирном банке и страховой компании Geico.
О Стабилитас
Компания Stabilitas была основана в 2013 году ветеранами армии США и выпускниками Гарвардской школы бизнеса и Школы государственных служащих имени Кеннеди. Они намеревались решить проблемы безопасности и недостатки, которые они обнаружили во время своей службы. «Мы использовали инструменты военной разведки, но мы не думали, что они достаточно перспективны. Чего-то не хватало». Стремясь улучшить обнаружение инцидентов, визуализацию данных и кризисную коммуникацию, они начали работу над технической платформой для специалистов по безопасности. Клиенты Stabilitas варьируются от небольших НПО до глобальных компаний. Стабилитас является выпускником Techstars 2015 года и получила грант Национального научного фонда SBIR, а также награду «Security’s Best» от ASIS International в 2015 году.