Что такое регрессионный анализ и как его использовать, чтобы лучше понять свой бизнес?
Автор Ань Ле. Подпишитесь на нее в Medium и LinkedIn, чтобы узнать больше. Также подпишитесь на Desa Analytics на Medium, чтобы получать уведомления о публикации новых блогов.
Введение
Y = mx + b — это первая регрессия, которую все учат. Это уравнение прямой линии, и вы можете использовать его, чтобы сделать простой прогноз любого события. Например, если у вас есть план мобильного телефона, вы можете предсказать, сколько вам придется заплатить, если у вас есть план с оплатой по факту использования.
По мере того, как мы углубляемся в науку о данных, вы поднимаете это уравнение до более надежной регрессии, которая может решать более сложные проблемы реального мира.
Что такое регрессия?
Регрессия — один из самых распространенных типов моделей машинного обучения. Он оценивает числовое значение отношения между входными переменными.
В Desa Analytics мы можем проектировать, создавать, тестировать и внедрять регрессионные модели для наших клиентов. Регрессии — это очень полезные алгоритмы, которые дают чрезвычайно полезную информацию для бизнеса. Помимо построения этих моделей, мы также включаем в них объяснимый ИИ, чтобы обеспечить полное понимание того, как работают эти мощные алгоритмы. См. статью в нашем блоге «Объяснимый ИИ», чтобы узнать больше о том, как он работает:
Приложения регрессии
Регрессия — это важный алгоритм машинного обучения, который может решать многие реальные проблемы с числовыми данными. Некоторые из этих приложений включают в себя:
- Прогнозирование финансовых показателей, таких как цены на акции и цены на жилье
- Прогноз погоды
- Расходы клиента
В зависимости от данных, контекста и временной шкалы вы можете эффективно применять регрессию для решения проблем.
Как компании используют это?
Регрессия — это базовый алгоритм, который используют многие предприятия из-за его простоты и эффективности. Компании используют регрессию для моделирования таких областей, как объем продаж, расходы клиентов и удержание сотрудников.
В малом бизнесе вы можете использовать регрессию, чтобы понять, почему звонки в службу поддержки упали в прошлом месяце, спрогнозировать продажи в течение следующих четырех месяцев или выбрать характеристики продукта.
Типы регрессии
Существует много типов сложной регрессии, но два наиболее распространенных и широко используемых — это линейная и логистическая регрессия. Кроме того, важно помнить, что более сложная модель не означает, что она лучше подходит для решения вашей конкретной проблемы. Регрессионные модели также легко построить и интерпретировать.
Линейная регрессия
Линейная регрессия — это подход к моделированию взаимосвязи между двумя или более переменными. Самый простой способ представить себе линейную регрессию — провести прямую линию через нанесенные на график точки данных. Цель состоит в том, чтобы нарисовать линию, которая лучше всего подходит, то есть она минимизирует расстояние между всеми точками данных на графике.
Линейную регрессию можно использовать в бизнесе для прогнозной аналитики. Любые возможности прогнозирования, для которых у вас есть данные, можно использовать в качестве прогнозного анализа. Например, вы можете прогнозировать спрос на свои продукты на основе проданного количества и цены продукта с течением времени.
Вы можете предсказать количество покупателей, которые посетят ваш магазин. Страховые компании прогнозируют кредитоспособность страхователей, чтобы получить возможное количество претензий за определенный период времени. С помощью линейной регрессии вы можете измерить, увеличит ли увеличение рабочих часов ваш бизнес продажи, и принять соответствующие решения. Вы можете сравнить операционные расходы и рабочее время, чтобы оптимизировать расходы. Возможность проверить свою гипотезу позволяет вам принимать более эффективные решения для вашего бизнеса и узнавать новые идеи.
Логистическая регрессия
Логистическая регрессия похожа на линейную регрессию, но немного отличается в своем применении. Когда у вас есть событие типа «сдал/не сдал», «победа/поражение», «здоров/болен» или «умер/жив», очень сложно смоделировать это с помощью линейной регрессии. Но эти проблемы распространены в реальном мире. Что, если вам нужно проанализировать, перестанет ли ваш покупатель приходить в ваш магазин в этих условиях? Тогда вам нужно будет использовать логистическую регрессию.
Логистическая регрессия присваивает вероятность от 0 до 1 с суммой 1 двум событиям, которые могут произойти при заданном наборе переменных. Для более технической аудитории он измеряет и отображает логистическую функцию с бинарной зависимой переменной.
Для этого примера у нас есть зачет или провал для студентов, и у нас есть данные о количестве часов, которые проучился каждый учащийся. После создания этой модели мы можем посмотреть на каждого учащегося, учитывая количество часов обучения, и сделать хороший прогноз того, сдаст или не сдаст этот учащийся с определенной вероятностью. Если студент учится три часа, вероятность его сдачи составляет 63%.
С теми же методологиями и интерпретациями мы можем применить это ко многим бизнес-задачам. Например, вы можете предсказать, какая часть машины выйдет из строя, в зависимости от продолжительности хранения материала в запасах. Разница между линейной и логистической регрессиями заключается в том, что линейная предназначена для непрерывных данных, а логистическая — для ограниченного диапазона значений или категориальных данных — да или нет, или A, B, C, D.
Распространенные ошибки, которые совершают компании, используя регрессию
При создании этих графиков легко предположить, что входная переменная может напрямую объяснить результат. Но мы должны помнить, что корреляция не означает причинно-следственную связь. Этого может быть достаточно для принятия решений, но недостаточно для того, чтобы сделать вывод, применимый ко всем ситуациям. Вам также необходимо хорошо знать вопрос, на который вы пытаетесь ответить, иначе вы рискуете искать идеи не в тех местах.
Не все данные идеальны и могут быть хорошо приспособлены для линейной или логистической регрессии, поскольку они могут иметь более сложные отношения. Принудительное включение данных в модель из-за того, что это просто, может привести к серьезным ошибкам прогнозирования. Чтобы найти наиболее подходящие модели для ваших данных и оптимизировать ваши бизнес-решения, требуется надежное тестирование.
Вывод
Регрессия — это простой и удобный способ делать прогнозы и анализировать различные переменные для вашего бизнеса. Это отличный способ понять бизнес по-разному и проверить свои гипотезы о бизнесе с помощью данных, а не только интуиции. Desa Analytics может предоставить методы регрессии для бизнес-проблем в сочетании с мощным объяснимым искусственным интеллектом.
Если вы хотите прочитать больше интересных статей на эту тему, посетите https://medium.com/@desaanalytics. Если вы хотите узнать больше о том, как ваша компания может использовать аналитику данных и искусственный интеллект для превращения идей в идеи, посетите www.desaanalytics.ca.
использованная литература
Автор Ань Ле. Подпишитесь на нее в Medium и LinkedIn, чтобы узнать больше. Также подпишитесь на Desa Analytics на Medium, чтобы получать уведомления о публикации новых блогов.