Узнайте, как мы используем машинное обучение, чтобы проводить рекламные кампании для пользователей торговой площадки с учетом их конкретных интересов.

Введение в проект торговых площадок Adevinta

Идея проста: в Адевинта мы хотим проводить рекламные кампании для целевых аудиторий, исходя из их конкретных интересов. Однако для этого нам необходимо определить интересы наших пользователей. Поскольку эти интересы могут носить сезонный характер, мы называем их хобби. Мы предполагаем, что можем узнать об увлечениях наших пользователей на основе их предыдущего поведения в Интернете. Решение интуитивно понятно: мы начинаем с сегментации пользователей на основе их прошлого поведения в Интернете, а затем нацеливаем и обогащаем их опыт в зависимости от того, в каком сегменте они находятся.

Однако у одного пользователя может быть несколько увлечений, хобби может быть сезонным, или интерес может быть глубоко привязан к временной шкале поведения пользователя. Поэтому сегментация пользователей для рекламных кампаний может не привести к продажам. Это также может быть неэффективным для увеличения трафика (посещений, кликов или конверсий) на наши торговые площадки (платформы, на которых покупатели могут продавать свои товары или услуги избранной группе клиентов).

Поэтому мы переопределили задачу на бинарную классификацию, где мы просто классифицируем, является ли пользователь потенциальным покупателем или нет. При таком подходе мы можем найти потенциальных покупателей в каждой категории и увеличить продажи за счет таргетинга рекламы на них.

К чему мы стремимся и почему

Наши торговые площадки имеют большую базу пользователей. Некоторые пользователи являются одноразовыми пользователями, основанными на потребностях, в то время как другие являются более регулярными из-за их привычек или времени года. Пользователи HomeNGarden, например, чаще посещают наши торговые площадки весной и летом, чтобы улучшить внешний вид своих садов, когда погода позволяет им проводить там больше времени. Другим примером являются любители летних видов спорта, которые, как правило, посещают рынки летом или ранее, чтобы купить летнее спортивное снаряжение. В результате понимание конкретных интересов пользователей на наших торговых площадках может быть полезным для привлечения нужного клиента в нужное время с нужным продуктом. Мы называем это силой трех R.

Почему нам нужно предлагать нужным пользователям нужный продукт в нужное время? Наиболее важными причинами являются:

  • Чтобы повысить активность пользователей на наших торговых площадках и расширить бизнес
  • Чтобы мотивировать клиентов придерживаться своего распорядка
  • Чтобы найти новых потенциальных клиентов

Как взломать это хобби

Мы начали работать над этой исходной идеей в команде во время хакатона в марте 2022 года. Трудной задачей было определение проблемы. Мы рассматривали возможность сегментации поведения пользователей, но это не соответствовало нашим целям, поскольку у одного пользователя может быть несколько увлечений (перекрывающихся интересов), а интересы пользователей могут меняться в зависимости от времени года. Мы также не смогли изучить сегменты из-за отсутствия четких меток сегментов. Не имея четких доказательств того, может ли это решение генерировать больше трафика и продаж, мы решили сосредоточиться на понимании намерений отдельных клиентов о покупке на основе их поведения.

Мы начали с того, что сосредоточились на одном хобби, HomeNGarden, и определили базовый уровень.

Исходный показатель: клиенты, совершившие покупку в течение предыдущих девяти месяцев, совершат еще одну покупку в ближайшие месяцы.

Исходные результаты адекватны, точность (процент правильных пользователей, пойманных моделью) составляет 75%, а отзыв (процент от общего числа правильных пользователей, которые захватили модель) — 44%.

Первоначальные модели машинного обучения (линейный подход) не могли превзойти базовые показатели, поэтому мы продолжили проводить A/B-тестирование кампании по электронной почте, используя базовые результаты. Электронная кампания прошла успешно. Мы установили новые ориентиры: коэффициент открытия электронных писем составляет 84 %, а рейтинг кликов – 0,68 %. Базовая модель показала значительное постепенное влияние на количество ответов и ответивших. Это продемонстрировало, что ориентация на потенциальных покупателей увеличит охват наших торговых площадок, поэтому мы повторили тот же модельный подход.

Подготовка набора данных

Мы использовали собственные данные, которые были легко доступны, в том числе: просмотры списков, поиски, поиски, сохраненные ими, ставки, избранное, удаление из избранного и сообщения, если покупатели взаимодействовали с продавцами.

Нам нужна была историческая информация о покупках от пользователей для маркировки, но одноранговые платежи обычно доступны только для подмножества товаров в каталоге, что приводит к ограничению данных этикеток для выявления шаблонов. Итак, мы определили и пометили connection2point (C2P) как покупку. Ниже приведено описание C2P с визуальным представлением на рисунке 6. В результате мы смогли сгенерировать достаточно данных меток для нашей модели.

C2P: покупатель отправляет сообщение продавцу, и продавец отвечает, затем покупатель отправляет ответное сообщение, указывая, что и покупатель, и продавец установили связь.

Определение проблемы для понимания модели

Набор данных представляет собой хронологическую коллекцию пользовательских событий, включая покупки, но нам нужно было выяснить, как сообщить модели, какое конкретное поведение указывает на намерение совершить покупку. План состоял в том, чтобы наблюдать за поведением в течение установленного периода времени и смотреть, повторяется ли оно. Но как точно и как долго мы должны исследовать поведение? Нам нужен был механизм разделения пользовательского поведения на сеансы с покупками и без них.

Мы экспериментировали с различными статическими временными разделами, чтобы наблюдать за поведением пользователей и вводить его в модель обучения с различными функциями на основе сеансов. Однако эти первоначальные разделы были слишком велики, чтобы точно определить поведение потенциальных покупателей.

На рынке подержанной электронной коммерции большинство пользователей не подписываются. Поэтому между пользователями и маркетплейсом нет установленного договора. Обычно пользователи активны только в течение короткого периода времени, прежде чем принять решение о покупке товара, поэтому мы выбрали более динамичный метод разделения поведения на более мелкие разделы. Затем мы наблюдали за поведением в небольших сессиях.

Мы собрали взаимодействия пользователей, отсортировали их по отметке времени и разделили на динамические сеансы. Большинство наших сессий длятся 30 минут или меньше, в соответствии со стандартами индустрии электронной коммерции. Следующие два правила описывают, как мы динамически разделили поведение пользователя:

  • Когда происходит событие p2p (покупка)
  • При отсутствии активности пользователя более 30 минут

Этап разработки функций

Разработка функций имеет важное значение, поскольку это означает, что мы можем использовать данные, собранные с наших платформ, чтобы делать предположения о наших пользователях. Для целей этого теста мы определили и определили атрибуты поведения пользователя, которые могут отражать намерение совершить покупку. Основываясь на исследованиях и знании предметной области, мы определили набор функций. Мы обсудим несколько поведенческих атрибутов и объясним, почему и как они указывают на намерение совершить покупку.

Количество просмотров
Количество просмотров элементов за сеанс: чем больше количество просмотренных элементов, тем выше интерес к продукту или категории.

Общее время пребывания
Общее время пребывания в сеансе: чем дольше клиент тратит, тем больше его интересует продукт или категория. Существует положительная связь между временем ожидания и интересом пользователя к элементам во время сеанса.

Время ожидания шага
Количество времени, потраченное на каждый продукт в сеансе: чем выше уровень интереса, тем дольше пользователь тратит на продукт.

Популярность
Самая высокая и самая низкая популярность просмотренных элементов за сеанс. Функции популярности показывают, насколько популярен продукт/объявление в данном сеансе. Чем популярнее продукт/листинг, тем больше вероятность того, что его купят. Это показывает, что пользователь имеет в виду определенный элемент и просматривает список несколько раз.

Особенность
Просматривает ли пользователь просто бесцельно (витринные покупки) или ищет что-то конкретное в определенной категории: пользователь, который просматривает в определенном жанре, с большей вероятностью чтобы купить продукт из этой категории.

Сезонность
Если пользователь просматривает страницы в соответствии с определенным сезоном: мы получаем характеристики, отражающие сезонность, потому что это может быть хорошим индикатором в сочетании с покупательским поведением.

Этап моделирования

Мы выбрали простую нейронную сеть с прямой связью (Multi-Layer Perceptron), потому что она хорошо выявляет нелинейные отношения и взаимодействия между функциями.

Модель превосходит базовый уровень с точностью 97% и полнотой 70%. Это означает, что модель хороша для поиска нужных клиентов, но не так хороша для поиска всех нужных клиентов с покупательским намерением.

Мы запланировали модель практически в режиме реального времени и рассчитали вероятность намерения пользователя купить продукт в каждой категории. В настоящее время потенциальные покупатели получают предложения листинга на основе их интересов или увлечений, но мы хотим использовать результаты этой модели для дальнейшей настройки домашних страниц пользователей для лучшей персонализации в дополнение к целевым кампаниям.

В заключение — успех!

Наш подход хорошо работал с методом машинного обучения, обеспечивая более сильные результаты, чем метод, основанный на правилах. С помощью универсальной модели, которую легко адаптировать к другим категориям или увлечениям, мы можем изменить функцию и настройку модели, чтобы найти потенциальных клиентов для конкретных кампаний. Например, если мы хотим запустить кампанию по продвижению спортивного снаряжения среди клиентов, мы можем ориентироваться на пользователей с более высоким уровнем покупательского намерения в спортивной категории. Кроме того, мы считаем, что этот продукт может масштабироваться на различных рынках.

Что будет дальше?

Ожидаются дальнейшие улучшения, поскольку в нашем текущем подходе мы не учитываем порядок событий. Например, когда пользователь просматривает объявление, тратит значительное время на список, избранное и делает ставки в списке, эта последовательность действий может указывать на четкое указание на намерение купить. Использование поведения последовательности и подходов к последовательности позволит нам улучшить релевантность и силу нашей модели. Как только будут доступны текущие результаты A/B-тестирования, мы продолжим улучшать нашу модель, чтобы еще эффективнее выявлять пользователей, намеревающихся совершить покупку, на наших торговых площадках.

Есть ли у вас какие-либо комментарии к нашей методике? Или советы по дальнейшим улучшениям? Пожалуйста, свяжитесь с нами.