Регрессионный анализ и классификация — популярные инструменты, используемые для прогнозирования. Оба используют одну и ту же концепцию использования известных наборов данных (также называемых обучающими наборами данных) для прогнозирования будущих новых точек данных, чтобы сделать вывод. Обе эти проблемы попадают в категорию Машинное обучение с учителем, где задача включает в себя изучение функции, которая сопоставляет входные данные с выходными на основе примеров пар входных и выходных данных, таких как y=f( x), математически известная как задача аппроксимации функций.
В машинном обучении задача включает в себя разработку модели, которая учится на исторических данных, что позволяет ей делать прогнозы для новых случаев. По сути, мы определяем, является ли задача классификацией или регрессией, по выходному значению. Значения вывода представляют собой дискретные метки (Мужской/Женский, Да/Нет, Истина/Ложь и т. д.) в классификации, тогда как они являются целыми числами/. float в регрессии.
Некоторые алгоритмы предназначены либо исключительно для задач стиля регрессии, таких как модели линейной регрессии, а некоторые алгоритмы предназначены исключительно для задач классификации, таких как логистическая регрессия. Однако есть некоторые алгоритмы, которые могут перекрываться после внесения в них небольших изменений, таких как деревья решений.
Цель этих задач состоит в том, чтобы как можно точнее аппроксимировать функцию отображения (f), чтобы всякий раз, когда есть новые входные данные (x), можно было предсказать выходную переменную (y) для набора данных. В регрессии природа прогнозируемых данных будет в некоторой последовательности (упорядоченной), тогда как природа прогнозируемых данных будет неупорядоченной в случае моделей классификации.
Примерами моделей классификации могут быть прогнозирование того, болен человек или нет, прогнозирование того, прибыльна ли фабрика или нет, прогнозирование того, подвержены ли болезни больше мужчины/женщины, и т. устанавливаются на основе ранее существовавших значений данных.
Примерами регрессионных моделей могут быть предсказание цены на землю на основе одной или нескольких независимых переменных, предсказание оптимального объема производства для максимизации дохода отрасли и т. д., когда выпуск отображается на графике и обобщается в виде уравнение, которое можно в дальнейшем использовать для будущих новых наборов данных.
Надеюсь, эта статья принесет вам пользу. Приятного обучения!