Обзор
Удержание клиентов является одной из основных целей любой отрасли, основанной на подписке. клиенты могут свободно выбирать из множества поставщиков даже в пределах одной категории продуктов. Несколько неудачных опытов — или даже один — и клиент может уйти. А если потоки неудовлетворенных клиентов будут стекать с одного места на другое, то и материальные потери, и репутационный ущерб будут огромными.
Что ожидать
В этой статье я собираюсь показать вам, как запачкать руки для создания модели, способной идентифицировать наших любимых клиентов с намерением покинуть нас в ближайшем будущем. Мы собираемся построить модель, используя передовые технологии машинного обучения. технологии. Хотя наша модель не идеальна, Но я за исключением того, что смогу вдохновить вас своей работой, чтобы вы могли реализовать ее в своей организации.
Загрузите наборы данных отсюда:
Скачать можно в репозитории github
Исследовательский анализ данных
В целом, наша конечная цель здесь — лучше понять наборы данных нашего банка с помощью визуализации и соответственно ответить на три вопроса. Мы построим нашу модель в конце статьи
Получение некоторого понимания из данных
На самом деле мы должны начать с инвестиций в наборы данных о том, как данные на самом деле распределяются между удержанным и уволенным клиентом. Для этого я нарисую круговую диаграмму, чтобы мы могли легко визуализировать
Как мы можем ясно видеть, наши данные содержат 20,4% ушедших клиентов и 79,6% удержанных клиентов.
предикторы
Мы собираемся посмотреть на пол, как пол нашего клиента связан с оттоком клиентов.
В среднем, женщины более склонны к оттоку, чем мужчины. Это дань статистическому факту, что женщины более консервативны, чем мужчины, с точки зрения риска и вознаграждения. Таким образом, банк может начать обращать внимание на своих клиентов-женщин. Таким образом, они могут значительно снизить скорость оттока.
Является активным участником
Это наиболее важная переменная, поскольку она дает нам индикатор того, пользуется ли клиент услугами банка. Это поможет нам сделать вывод о том, кто является любимым клиентом и кто собирается сбить банк
Неактивные участники покидали банк чаще, чем активные. Более того, неактивные участники также оказались менее финансово ответственными, поскольку их кредитный рейтинг был ниже.
Настало время ответить на первый интересный вопрос.
Какой пол имеет самый высокий уровень оттока и является ли он активным или неактивным участником?
Из приведенного выше графика видно, что доля оттока клиентов-женщин также больше, чем доля клиентов-мужчин. Неудивительно, что у неактивных членов отток больше. Беспокоит тот факт, что общая доля неактивных членов довольно высока, что говорит о том, что банку может понадобиться программа, чтобы превратить эту группу в активных клиентов, поскольку это определенно окажет положительное влияние на отток клиентов.
Есть кредитная карта
Это необходимо знать тому, кто пользуется банковскими услугами, такими как кредитная карта. Каковы шансы на их сохранение.
Ответить на второй вопрос
У какого клиента более высокая скорость оттока: у того, кто пользуется нашими услугами, такими как кредитная карта, или у того, кто не пользуется услугами часто?
Интересно, что большинство клиентов, которые ушли, это клиенты с кредитными картами. Учитывая, что у большинства клиентов есть кредитные карты, это может оказаться просто совпадением. Это напоминает мне, что
Корреляция не подразумевает причинно-следственной связи
Возраст
Из диаграммы видно, что более молодые клиенты с меньшей вероятностью покинут банк, поскольку они все еще не так образованы или не имеют такого же богатства выбора, как люди среднего возраста, учитывая, что у них не было времени улучшить свой кредитный рейтинг. пока что.
Кредитный рейтинг
Кредитный рейтинг в основном основан на кредитном отчете, информация, как правило, поступает из кредитных бюро. Кредиторы, такие как банки и компании, выпускающие кредитные карты, используют кредитные рейтинги для оценки потенциального риска, связанного с кредитованием потребителей, и для уменьшения потерь из-за безнадежных долгов.
Срок пребывания
Срок владения – это период или продолжительность, на которую санкционируется сумма кредита. Личные кредиты, автокредиты, кредиты на образование имеют более короткие сроки по сравнению с ипотечными кредитами. Некоторые банки и финансовые учреждения продлевают срок кредита за дополнительную плату или небольшое повышение процентной ставки.
Переходим к третьему вопросу
Есть ли связь между возрастом и стажем работы?
Пожилые клиенты обращают на себя больше внимания, чем младшие, что намекает на разницу в предпочтениях в обслуживании в возрастных категориях. Банку, возможно, потребуется пересмотреть свой целевой рынок или пересмотреть стратегию удержания между различными возрастными группами. Что касается срока пребывания в должности, то клиенты на крайнем конце (проводили мало времени в банке или много времени в банке) более вероятно, отточат по сравнению с теми, которые имеют средний срок пребывания в должности.
Если вы вдохновлены, чтобы запачкать руки для создания своей модели, тогда не стесняйтесь клонировать мой репозиторий github
Отражение
Уровень оттока — это показатель здоровья для компаний, работающих по подписке. Возможность выявлять клиентов, которые недовольны предоставленными решениями, позволяет компаниям узнавать о слабых местах продукта или тарифного плана, проблемах в работе, а также о предпочтениях и ожиданиях клиентов, чтобы заранее уменьшить причины оттока.
Важно определить источники данных и период наблюдения, чтобы иметь полную картину истории взаимодействия с клиентом. Выбор наиболее значимых характеристик модели будет влиять на ее прогностическую эффективность: чем качественнее наборы данных, тем точнее прогнозы.
Компании с большой клиентской базой и многочисленными предложениями выиграют от сегментации клиентов. Количество и выбор моделей машинного обучения также могут зависеть от результатов сегментации. Специалистам по данным также необходимо отслеживать развернутые модели, а также пересматривать и адаптировать функции для поддержания желаемого уровня точности прогнозов.