Модели машинного обучения - логистическая регрессия

Введение

Темы, которые будут освещены в этом блоге:

Что такое логистическая регрессия?
Почему бы не использовать линейную регрессию
Дополнительная информация о логистической регрессии
Оценка максимального правдоподобия.
Функция затрат в логистической регрессии
Градиентный спуск
Реализация Python

Чтобы понять логистическую регрессию, необходимо знать о линейной регрессии, о которой мы уже говорили ранее.

Что такое логистическая регрессия?

Логистическая регрессия - это обобщенная линейная модель. В отличие от линейной регрессии, которая используется для прогнозирования значений в соответствии с числовыми данными, логистическая регрессия используется для проблемы классификации. Некоторые из примеров проблем классификации - это классификатор спама в электронной почте. , классификация видов ирисов, выявление мошенничества с кредитными картами.

Тогда почему это называется логистической регрессией?

Логистическая регрессия фактически предсказывает значение вероятности зависимого признака, которое находится в диапазоне [0,1]. Если это проблема двоичной классификации, и если значение больше или равно 0,5, то оно классифицируется как истинное, иначе оно классифицируется как ложное. Однако мы знаем, что в линейной регрессии диапазон составляет от отрицательной бесконечности до положительной бесконечности, но здесь мы имеем значение между [0,1]. Для решения этой проблемы у нас есть функция, известная как сигмовидная функция. сигмовидная функция дает волнистую линию.

Почему бы не использовать линейную регрессию?

Первая очевидная причина заключается в том, что логистическая регрессия - это модель классификации, в отличие от линейной регрессии. Диапазон линейной регрессии составляет от отрицательной бесконечности до положительной бесконечности, поэтому она может генерировать отрицательные прогнозы. В то время как логистическая регрессия в диапазоне между [0,1] не имеет такой проблемы.

Другая проблема линейной регрессии заключается в том, что при наличии некоторых выбросов линия наилучшего соответствия будет наклонена в сторону выброса, что приведет к неверным прогнозам.

Дополнительная информация о логистической регрессии.

Как было сказано ранее, логистическая регрессия в чем-то похожа на линейную регрессию. Чтобы предсказать наиболее подходящую волнистую линию, мы преобразуем эту волнистую линию в прямую, используя функцию логита, которая принимает вероятность в качестве входных данных и дает логарифм шансов в качестве выходных данных.

Для каждой точки мы будем вычислять журнал нечетных значений, и эти значения используются по оси Y на графике. Таким образом мы можем создать прямую линию для волнистой линии.

Оценка максимального правдоподобия

В линейной регрессии мы используем метод наименьших квадратов, который представляет собой сумму квадратов ошибки, чтобы найти наиболее подходящую линию. На рис. 2, поскольку большинство точек стремится к отрицательной бесконечности и положительной бесконечности, значение ошибки также будет стремиться к бесконечности. Мы не можем использовать метод наименьших квадратов, вместо этого мы используем оценку максимального правдоподобия.

Мы вычисляем максимальную вероятность каждой логарифмической (шансов) точки и умножаем все правдоподобия, чтобы получить вероятность полного набора данных. Волнистая кривая, которая получает значение максимального правдоподобия для полного набора данных, считается наилучшей волнистой кривой.

Как увеличить вероятность журнала?

В статистике для получения параметра распределения широко используется оценка максимального правдоподобия (MLE). В этой парадигме максимизация логарифмической вероятности равна минимизации функции затрат J. Это двойная проблема в Convex Optimization.

Функция затрат в логистической регрессии

Мы узнали о функции стоимости J (θ) в линейной регрессии, функция стоимости представляет собой цель оптимизации, т.е. мы создаем функцию стоимости и пытаемся минимизировать функцию стоимости с помощью градиентного спуска. так что мы можем получить глобальные минимумы.

Итак, если мы попытаемся использовать функцию стоимости линейной регрессии для функции гипотезы (сигмовидное уравнение) логистической регрессии, то будет замечено, что она дает невыпуклую функцию. В невыпуклой функции мы получаем локальный минимум в дополнение к глобальному минимуму, и найти глобальный минимум будет сложной задачей.

Для логистической регрессии функция затрат определяется как: -

Два приведенных выше уравнения можно объединить, чтобы получить новое уравнение:

Теперь, используя эту функцию стоимости, мы можем определить глобальные минимумы с помощью градиентного спуска.

Градиентный спуск

Градиентный спуск для логистической регрессии такой же, как и для линейной регрессии. Теперь, чтобы минимизировать нашу функцию затрат, нам нужно запустить функцию градиентного спуска для каждого параметра, т.е.

Реализация Python

Итак, важно увидеть, как использовать то, что мы приобрели. Я применил логистическую регрессию к радужке, которая может классифицировать виды на основе измерений длины и ширины чашелистиков и лепестков.

Нажмите ЗДЕСЬ, чтобы увидеть полный код, и посмотрите, насколько прост в мире машинного обучения, когда дело касается логистической регрессии.

Заключение

В этом блоге я познакомил вас с основными концепциями логистической регрессии, которые мы должны знать. Я надеюсь, что это было полезно и поддерживало вашу мотивацию.

Спасибо за прочтение. :)
И, если бы это было хорошее прочтение. Наслаждайтесь!

Редактор: Ашишкумар

смотрите также:

Новые материалы

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning