Как компании могут извлечь выгоду из алгоритмов дерева решений?
Автор Ань Ле. Следуйте за ней в Medium и LinkedIn, чтобы узнать больше. Пожалуйста, также следите за Desa Analytics на Medium, чтобы получать уведомления о публикации новых блогов.
Введение
В повседневной жизни мы все принимаем решения в зависимости от обстоятельств и событий. Чтобы принять решение, мы выбираем между множеством альтернатив, которые ведут нас разными путями к достижению ожидаемых результатов этого решения. Алгоритмы дерева решений работают одинаково и могут быть созданы для воспроизведения этого процесса принятия решений. Это может быть применено к построению финансовых моделей для разработки цепочек действий и событий бизнес-стратегии.
Как владелец бизнеса вы можете захотеть привлечь новых клиентов, но ваш бюджет ограничен. Вам необходимо выполнить оптимизацию для правильного целевого рынка, чтобы превратить ваши маркетинговые расходы в новых клиентов. Так как же идентифицировать этих людей? Вам понадобится алгоритм классификации, который сможет идентифицировать этих клиентов. Вот здесь и пригодятся деревья решений. Вы можете использовать свои текущие данные о клиентах для построения дерева решений. Данные должны иметь атрибуты (характеристики) клиентов и целевой результат (метку), чтобы указать на их преобразование.
Что такое деревья решений?
Дерево решений может разделить ваши наборы данных на более мелкие подмножества на основе описательных функций, пока вы не поместите все точки данных в их соответствующие метки. Как правило, дерево решений задает вопрос, а затем классифицирует результат на основе ответа.
Это дерево решений основано на вопросе «да / нет». Вы также можете построить дерево с числовыми данными.
Дерево решений также может быть основано на ранжированных данных, где один из них очень голоден, а два - умеренно.
Если человек очень голоден, ему нужно поесть. Если человек умеренно голоден, ему необходимо перекусить. А если совсем не голодны, то и есть не нужно.
Классификация может быть категориальной или числовой. Окончательные классификации можно повторить. По большей части деревья решений довольно интуитивно понятны для работы. Вы начинаете сверху и продвигаетесь вниз, пока не дойдете до точки, в которой вы не сможете продвинуться дальше, и именно так вы классифицируете образец.
Вы можете использовать любые данные и превратить их в категориальные переменные, чтобы поместить их в узлы. Модель будет обучена с использованием данных, и принятое решение будет зависеть от того, какой путь и граница приведут к максимальному увеличению объема информации.
Компоненты дерева решений
Самая верхняя часть дерева называется Корневой узел. Внутренние узлы имеют стрелки, указывающие на них, и стрелки, указывающие от них. Наконец, на листовых узлах есть стрелки, указывающие на них, но никакие стрелки не указывающие от них.
Каждая функция вашего набора данных может стать корневым узлом. Каждый результат может стать листовым узлом. Для набора данных с большим количеством функций вам нужно будет определить, какие из этих функций входят в какие ветви, чтобы сформировать хорошее дерево решений. Например, дерево классификации может определить, выжил ли пассажир в авиакатастрофе или погиб. Существует также дерево регрессии, которое может предсказывать непрерывные переменные, такие как цена опциона на акции.
Деревья решений предназначены для разделения данных по различным переменным на два результата, например, покупает ли покупатель продукт или нет. Этот метод предназначен для удаления примесей, снижения энтропии в популяции и получения подмножества клиентов с соответствующими этикетками. В каждом узле вы должны рассчитать оценку примесей, чтобы решить, какие узлы / решения двигаться вперед для дальнейшего разделения ваших данных.
В Desa Analytics мы можем проектировать, создавать, тестировать и внедрять деревья решений для наших клиентов. Деревья решений - это мощные алгоритмы, которые предоставляют чрезвычайно полезную информацию для бизнеса. Помимо построения этих деревьев решений, мы также включаем Объясняемый ИИ в наши модели, чтобы обеспечить полное понимание того, как работают эти мощные алгоритмы. См. Запись в нашем блоге об Объяснимом ИИ, чтобы узнать больше о том, как это работает:
Пример более сложного дерева решений
Плюсы деревьев решений
Деревья решений имеют высокую интерпретируемость для пользователя, их легко понять и объяснить. Для построения не требуется тонкая подготовка данных и нет необходимости нормализовать данные.
Минусы деревьев решений
Деревья решений имеют риск переобучения на основе выбросов в данных. По мере того, как вы углубляетесь в деревья, вероятность переобучения выбросами возрастает. Таким образом, деревья решений ограничиваются менее сложными данными. Чтобы облегчить это, мы можем использовать процесс обрезки, чтобы уменьшить переобучение.
Какие проблемы решают деревья решений?
Деревья решений отлично подходят для решения задач классификации, где результаты часто бывают двоичными - True или False. Вы можете использовать это, чтобы узнать, откажется ли клиент от вашего продукта на основе подписки. Он также может решать задачи классификации на несколько классов, такие как: «оттянутый клиент», «преобразованный покупатель», «конвертирующий, если они видят релевантную рекламу» или «никогда не купят продукт».
Чтобы принять правильное решение при применении деревьев решений, владелец бизнеса должен предпринять четыре шага:
- Распознайте проблему и получите соответствующие данные
- Признайте ограничения
- Определить и оценить возможности выбора наилучшего варианта
- Положите ответ на проблему и следите за результатами
Риски против возможностей
Риски
Мы ежедневно сталкиваемся с решениями и неопределенностью, и деревья решений могут принимать эффективные решения эффективно и точно для предприятий. Неправильные решения могут дорого обойтись, если не будут приняты должным образом. Вот почему важно правильное использование деревьев решений. Но деревья решений также сопряжены с рисками, поскольку им мешают слишком большие наборы данных, переоснащение и предвзятость.
Информация в решении полагается на точный ввод, чтобы предоставить пользователю надежный результат. Однако модель может быть чувствительной к небольшим изменениям данных и должна учитываться в процессе построения модели. Получение надежных данных также может быть проблемой для бизнеса. Неточные и ненадежные данные могут привести к неверным результатам из дерева решений, увеличивая сметные затраты для бизнеса.
Деревья решений должны быть простыми, чтобы оптимизировать их точность и эффективность. Неотъемлемо то, что выбираются только самые качественные и релевантные данные, что делает человека в цикле неотъемлемой частью процесса построения модели. Посетите наш недавний блог о важности человеческого интеллекта как об одном из основных мифов, которые Desa Analytics помогает развенчать:
Прежде чем сделать выбор, бизнес должен сначала определить риски. Поскольку лучшие суждения часто основываются на данных, а не только на опыте, данные необходимо собирать на ранних этапах проекта. Своевременное получение информации снизит вероятность возникновения непредвиденных происшествий. Для эффективного использования все данные должны быть обработаны и организованы по соответствующим категориям.
Вывод
Деревья решений могут использоваться для облегчения процесса принятия бизнес-решений по снижению рисков. Деревья решений более эффективны, чем другие инструменты принятия решений, их легко понять и использовать. Правильное использование деревьев решений может эффективно локализовать и решать проблемы.
Если вы хотите прочитать больше интересных статей по этой теме, посетите https://medium.com/@desaanalytics. Если вы хотите узнать больше о том, как ваш бизнес может использовать аналитику данных и искусственный интеллект для превращения идей в идеи, посетите www.desaanalytics.ca.
использованная литература
Что такое алгоритм дерева решений?
Гость, автор: Ребекка Ньери!
Что такое дерево решений? medium.com
Автор Ань Ле. Следуйте за ней в Medium и LinkedIn, чтобы узнать больше. Пожалуйста, также следите за Desa Analytics на Medium, чтобы получать уведомления о публикации новых блогов.