Автоматическая кластеризация с AuDaS
Проблема номер один, с которой сталкиваются маркетологи, - это понять, кому они продают. Когда вы знаете, как выглядят ваши покупатели, вы можете адаптировать таргетинг и предложения, чтобы повысить их удовлетворенность и, как следствие, свой доход. Когда у вас уже есть группа клиентов и достаточно данных о них, может быть очень полезно их сегментировать. В этой статье мы увидим, как мы можем использовать кластеризацию для сегментации некоторых клиентов с кредитными картами. Данные для этого анализа были взяты из Kaggle, и мы будем использовать AuDaS для автоматической идентификации кластеров.
Данные
Данные кредитной карты имеют 17 атрибутов для каждого клиента, которые включают баланс (кредит, причитающийся с клиента), денежный аванс (когда клиент снимает наличные с помощью кредитной карты), кредитный лимит клиента, минимальный платеж, процент от полных платежей и срок владения. .
Данные довольно чистые, но в них есть некоторые недостающие значения, которые автоматически подбираются AuDaS.
После применения рекомендаций по подготовке данных, предложенных AuDaS, мы можем просматривать гистограмму клиентов кредитной карты.
Кластеризация
Теперь, когда мы подготовили данные, мы собираемся построить модель кластеризации с использованием AuDaS. Нам нужно указать количество кластеров, и в нашем случае мы начнем с 8.
После применения конвейера Кластеризация K-средних AuDaS создает показатели оценки и информацию о кластерах, которые он идентифицировал.
График Силуэт дает нам хорошее представление о том, насколько хорошо определены наши кластеры. Коэффициент силуэта между -1 и 1 показывает, насколько близко каждая точка в одном кластере находится к точкам в соседних кластерах. Значения, близкие к 1, наиболее удалены от других кластеров, тогда как отрицательные точки перекрываются с другими. В идеальной ситуации мы ожидаем, что все точки кластера будут иметь коэффициенты силуэта, близкие к 1. В нашем случае большинство кластеров кажутся довольно хорошо определенными, за исключением кластеров 2 и 7.
Затем мы можем использовать функцию визуализация t-SNE, чтобы проверить различимость наших кластеров. Как мы видим, кластеры 2 и 7 имеют ряд точек, которые перекрываются с другими кластерами. Чтобы улучшить различимость наших кластеров, мы можем решить собрать дополнительную информацию от наших клиентов.
Сегментация клиентов
AuDaS предоставляет координаты центроидов, которые можно использовать для интерпретации основных характеристик каждого кластера.
Затем мы можем расширить таблицу:
AuDaS автоматически создаст новый набор данных с добавленными кластерами каждого клиента, которые вы можете экспортировать, и, получив доступ к представлению гистограммы, мы можем понять, как кластеры распределяются по набору данных. Теперь мы более подробно рассмотрим некоторые из наиболее интересных кластеров, выявленных AuDaS.
Кластер 1
Для этого сегмента характерны клиенты с наименьшим остатком (104) и авансом (302) и довольно высоким процентом полных платежей (24%). Эти клиенты известны как участники транзакций, поскольку они платят небольшие проценты.
Кластер 2
Этот сегмент характеризуется клиентами, у которых есть большие остатки и авансы наличными, а также одна из самых низких частот покупок и процента полных платежей, что указывает на то, что они являются одним из самых прибыльных сегментов для провайдера кредитной карты. Их обычно называют револьверами, которые могут использовать свою кредитную карту в качестве ссуды.
Кластер 4
Для этого сегмента характерны клиенты с самым высоким кредитным лимитом и самым высоким процентом полных платежей (39%). Это основные клиенты, которых поставщик кредитных карт может побудить увеличить их привычки тратить, еще больше увеличив кредитные лимиты.
Кластер 5
В этот сегмент входят довольно новые клиенты (с малым сроком владения), у которых низкий баланс и небольшой аванс. Провайдер кредитной карты может побудить их увеличить свою активность, предлагая кэшбэк, рекламные акции, бесплатные поездки на Uber и т. Д.
Заключение
За пару минут мы смогли построить модель кластеризации, которая смогла разделить пользователей наших кредитных карт на отдельные группы. Некоторые из них были довольно классическими, например, премиум-сегмент, револьверы и транзакции, но мы также смогли выявить неактивных пользователей. Понимание поведения клиентов на этом уровне детализации является ключом к разработке предложений, которые улучшают удержание клиентов и увеличивают доходы.
Полное видео процесса построения модели кластера с помощью AuDaS можно посмотреть ниже:
AuDaS
AuDaS - это платформа автоматизированного анализа данных, разработанная Mind Foundry, которая обеспечивает надежную основу для создания комплексных решений машинного обучения (классификация, регрессия, кластеризация и вскоре временные ряды). Эта структура помогает выявить утечку данных и отреагировать на нее, пока еще не поздно. Вы можете попробовать AuDaS, отправив электронное письмо на адрес [email protected] и ознакомившись с некоторыми другими практическими примерами использования здесь и здесь.
[ОБНОВЛЕНИЕ: я основал техническую компанию. Вы можете узнать больше здесь]
Команда и ресурсы
Mind Foundry - это дочернее предприятие Оксфордского университета, основанное профессорами Стивеном Робертсом и Майклом Осборном, у которых 35 человеко-лет в области анализа данных. Команда Mind Foundry состоит из более чем 30 исследователей машинного обучения мирового уровня и элитных инженеров-программистов, многие из которых в прошлом были докторантами Оксфордского университета. Кроме того, Mind Foundry имеет привилегированный доступ к более чем 30 кандидатам машинного обучения Оксфордского университета благодаря своему статусу отделения. Mind Foundry является портфельной компанией Оксфордского университета, и ее инвесторами являются Oxford Sciences Innovation, Оксфордский фонд технологий и инноваций, Инновационный фонд Оксфордского университета и Parkwalk Advisors.