Посещая многочисленные конференции, посвященные платежам и обнаружению мошенничества, такие как ATPS или MRC, можно легко заметить, что машинное обучение (ML) сейчас у всех на слуху. Однако постоянно растущая популярность этой темы сопровождается появлением и распространением все большего количества мифов и слухов. Чтобы прояснить ситуацию, мы подготовили это краткое руководство, которое поможет вам начать работу.

Машинное обучение для обнаружения мошенничества - определение

В настоящее время машинное обучение применяется практически во всех сферах бизнеса: прогнозирование оттока клиентов, кредитный рейтинг, рекомендации по предложениям (например, Amazon или Netflix) и многое другое. Машины могут пилотировать самолет, водить машину, читать тексты и распознавать их чувства и даже писать короткие романы или сочинять музыку. Они уже обыграли людей в одной из популярных многопользовательских кооперативных игр - DOTA2.

Эта технология также оказалась чрезвычайно эффективной в борьбе с мошенничеством.

… .Но что такое машинное обучение в контексте обнаружения мошенничества?

Проще говоря:

Машинное обучение - это область информатики, которая позволяет машине научиться отличать мошенников от законных пользователей, не сообщая явно, что именно нужно искать.

Давайте погрузимся глубже…

Идея состоит в том, что есть определенные характеристики мошеннических транзакций, которые отличают их от законных. Алгоритмы машинного обучения распознают закономерности в данных, которые позволяют им отличать мошенников от законных клиентов на основе тысяч единиц информации, которая иногда может показаться совершенно не связанной с человеком. Алгоритм ищет закономерности в поведении мошенников, их аппаратных характеристиках и т. Д.

Применение машинного обучения в бизнесе

Всякий раз, когда клиент выполняет транзакцию, модель машинного обучения тщательно изучает их профиль в поисках подозрительных шаблонов.

В зависимости от серьезности обнаруженных «мошеннических» шаблонов такая транзакция может быть принята, заблокирована или передана на проверку вручную. Все делается за миллисекунды.

Особенность машинного обучения заключается в том, что оно позволяет с очень высокой точностью обнаруживать мошеннические транзакции. Возьмем пример Almundo.com. Этот популярный онлайн-турагент из Латинской Америки сократил количество случаев мошенничества, возвратных платежей и ручных проверок на 70% благодаря машинному обучению.

Такое сокращение приводит к лучшему клиентскому опыту (меньше ложных срабатываний), оптимизации операционных расходов и значительному увеличению доходов.

Машинное обучение не нацелено на замену менеджеров по рискам - оно предоставляет им более мощный инструмент для выполнения своей работы!

Почему машинное обучение важно?

Есть несколько причин, по которым компаниям следует рассмотреть возможность включения машинного обучения в свою стратегию обнаружения мошенничества. Я выбрал те, которые считаю наиболее важными.

Интернет-мошенничество стало более изощренным благодаря быстрому развитию технологий, доступных мошенникам. Поэтому, чтобы оставаться на шаг впереди себя, компаниям необходимо анализировать гораздо больше данных, чтобы успешно обнаруживать попытки мошенничества. Однако опытный аналитик может охватить, скажем, до 10–20 единиц информации. А Машинное обучение позволяет анализировать тысячи функций, причем в мгновение ока.

Традиционный подход к обнаружению мошенничества с использованием статических систем на основе правил (также известных как производственные или экспертные системы) имеет свои недостатки, которые делают его менее эффективным:

  1. Между определением потребности в новом правиле и его реализацией существует задержка - машины сделают это практически мгновенно.
  2. Системы, основанные на статических правилах, сильно зависят от человеческого труда, который стоит дорого. Особенно, если данный торговец расширяется на новые рынки, поскольку это подразумевает необходимость в найме большего количества аналитиков рисков из-за этих рыночных закономерностей, которые необходимо проанализировать.
  3. Правила создаются людьми, которые используют свой опыт, знания и аналитические способности. Однако, поскольку атаки мошенничества стали более изощренными, правила также стали более сложными и подверженными ошибкам. Это приводит к большим потерям денег и увеличению количества ложных срабатываний.
  4. Системы правил разрастаются до неконтролируемых размеров, каждая новая обнаруженная схема мошенничества превращается в правило. Через некоторое время у продавца остается 150 правил, влияние которых трудно проанализировать с течением времени. С помощью машинного обучения вы сможете быстрее проверить его эффективность и быстрее адаптироваться к меняющейся реальности.

И наконец, что не менее важно, машинное обучение позволяет четко разрабатывать бизнес-стратегию на основе ключевых показателей эффективности и созданных прогнозов попыток мошенничества. Можно предвидеть уровни отказа, принятия или проверки вручную, чтобы максимизировать доход . Это означает, например, что вы можете понять, на каком уровне отказов, сколько мошеннических транзакций будет выявлено.

Как предсказать мошенничество с помощью машинного обучения

В этом сообщении в блоге я представляю упрощенную версию процесса машинного обучения, чтобы дать вам общее представление о том, что это такое.

Шаг 1: Определение целей проекта

Прежде всего, вам необходимо определить свои бизнес-цели. Ваши цели могут включать, например:

  1. Минимизация расчетного коэффициента возвратных платежей.
  2. Минимизация количества ложных срабатываний («ложные срабатывания»).
  3. Поддержание коэффициента ручного обзора (эксплуатационные расходы) на контролируемом уровне.
  4. Определение клиентских сегментов, приносящих наибольшую прибыль, и т. Д.

Вот несколько общих вопросов, на которые нужно ответить на шаге 1:

  1. Что нужно вашей компании?
  2. Каковы основные КПЭ?
  3. Каковы источники дохода и самые большие препятствия для его получения?
  4. Каковы критерии успеха проекта?

…и более.

На техническом уровне наша главная цель - предсказать, является ли данная транзакция частью дохода или попыткой мошенничества.

Шаг 2: подготовка данных

Представьте, что вы хотите освоить новый навык. Что вы делаете? Вы ищете образовательную информацию. Читайте книги, руководства, различные статьи, задавайте вопросы на форумах, разговаривайте с профессионалами в этой области и т. Д.

То же самое и с машинами - для создания профилей мошенников им нужны исторические данные о предыдущих мошеннических событиях. Чем больше функций и данных соберет компания для анализа, тем лучше. Это может быть время, частота или сумма транзакции, история предыдущих покупок, информация о геолокации, отчет о возвратных платежах и т. Д.

Затем эти необработанные данные следует очистить и подготовить в форме, понятной для машин. Это может занять некоторое время (обычно это 60% - 80% всего процесса машинного обучения) и требует определенных технических навыков. Поэтому рекомендуется развивать такую ​​компетенцию внутри вашей компании или передавать ее внешнему поставщику.

Результатом шага 2 является исходный набор данных, который будет использоваться для дальнейшего анализа (см. шаг 3). Ниже вы найдете упрощенный пример того, что можно получить в результате подготовки данных. Имейте в виду, что на практике такой набор данных может включать сотни или тысячи столбцов и даже миллионы строк.

Как видите, в нашем примере каждая транзакция (строка) описывается набором функций (столбцов). Последний столбец называется цель. Он указывает, оказалась ли конкретная транзакция мошенничеством. Неважно, как вы отметите мошенничество в своих данных, это вам решать. Цель может принимать значения «1», «F», «Мошенничество» и т. Д. Неважно, какие транзакции ваша компания считает мошенническими - алгоритмы машинного обучения будут искать шаблоны, которые отличают класс «1» от «0». . Однако стоит отметить, что точность алгоритма зависит от качества столбца «Цель». Конечно, сильная сторона ML также заключается в возможности определения большего количества категорий, например - хороший клиент, постоянный клиент, мошенник.

Шаг 3. Построение модели машинного обучения

Подождите, машинное обучение, что…?

Модель машинного обучения.

В этом и заключается весь процесс машинного обучения, его конечный продукт. После получения информации о новой транзакции модель выдаст рекомендацию о том, имеете ли вы дело с попыткой мошенничества или нет.

В процессе построения такой модели берется набор данных из шага 2, чтобы выяснить, что характеризует отмеченные мошеннические транзакции и каковы наилучшие предикторы мошенничества. Поскольку могут быть сотни функций, описывающих транзакции, клиентов и их поведения, проанализировать и сделать осмысленный вывод - нетривиальная задача.

Для этого процесса требуются надлежащие технологии и специалисты по данным со знанием предметной области, чтобы знать, как комбинировать различные виды данных, какой метод моделирования будет наиболее подходящим для конкретного бизнес-сценария и данных, какой будет лучший набор параметров модели и многое другое.

Шаг 4. Делаем прогноз

Итак, у нас есть модель машинного обучения… и что?

Сделайте так, чтобы это работало на ваш бизнес! Теперь модель должна быть развернута и интегрирована с вашей ИТ-инфраструктурой.

Каждый раз, когда покупатель покупает товар / услугу в вашем интернет-магазине, данные об этой транзакции будут отправляться в модель. Модель сгенерирует рекомендацию, на основе которой ваша система транзакций примет решение об утверждении, блокировке или пометке для проверки вручную.

Этот процесс называется оценкой данных.

Но это еще не конец. Если во время проверки вручную член группы по выявлению мошенничества пометит подозрительную транзакцию как законную (ложное срабатывание) , модель машинного обучения учтет эту информацию, чтобы в следующий раз принять более правильное и точное решение.

Шаг 5. Обновление модели

Модели, работающие в производственной среде, подвергаются мгновенной обратной связи с новыми возвратными платежами и постоянно переобучаются, чтобы иметь возможность обнаруживать новые возникающие мошеннические модели. Как и в реальной жизни, люди, не обучающиеся стимулам, ухудшают свои интеллектуальные способности, То же самое и с моделями.

Как я уже упоминал, мошеннические атаки становятся все более изощренными, поэтому для успешного обнаружения мошенничества требуется больше данных. Например, подробные характеристики устройства (например, возможности графического процессора, вычислительная мощность, тип подключения, использование виртуальной машины или VPN-соединение) могут дать много нового представления о потребителе и повысить точность прогнозов.

Рекомендуется искать новые источники информации или использовать одну из доступных систем защиты от мошенничества, которая собирает до 3000 точек данных и анализирует их, чтобы создавать более точные и подробные профили мошенников.

Александр Киек, технический директор Nethone

Первоначально опубликовано на nethone.com 18 августа 2017 г.