В этом посте я кратко расскажу, объясняя основы того, что такое машинное обучение и модель обучения.
Что такое машинное обучение?
Оксфордский словарь определяет машинное обучение как:
«Способность компьютера учиться на собственном опыте»
Машинное обучение направлено на разработку алгоритмов, которые могут научиться выполнять конкретную задачу на основе данных примера. Вот пример. Допустим, мы хотим написать программу для игры. Мы могли бы написать эту программу, вручную определив правила игры. Мы могли бы запрограммировать некоторые стратегии открытия и правила принятия решений. Но есть проблема. Этот подход может быстро усложниться, если вы программируете эти правила вручную. Лучшим решением является создание алгоритмов машинного обучения. Машинное обучение может научиться играть в игру на основе примеров и опыта, как и люди.
Модели обучения
Модель обучения может различаться в зависимости от наборов данных и сферы деятельности, но, говоря простым языком, модель изучает функцию f, как принимать X (т. е. функции или независимые переменные для прогнозирования y. Например, если я обучаю модель на основе набора данных о свойствах, включая размер дома (X) и цену продажи (y), я мог бы оценить цену другого объекта, используя аналогичные данные о жилье.
Я буду использовать простую модель линейной регрессии, чтобы объяснить два основных параметра обучения ML(функция стоимости) и минимизировать функцию стоимости (градиентный спуск). Хотя линейная регрессия не является самой мощной моделью в ML, она проста для понимания и является одной из наиболее широко используемых моделей для оценки линейных отношений между двумя или более непрерывными и/или категориальными данными и непрерывной выходной переменной.
Учебные модели используют помеченные данные, настраиваемые параметры и алгоритм оптимизации для определения модели. Алгоритм оптимизации пытается найти наилучшую комбинацию параметров, чтобы в примере x выход модели y максимально приближен к ожидаемому результату. Типичные модели машинного обучения имеют тысячи или миллионы параметров, поэтому невозможно найти выходные данные y модели f для входных данных x, перепробовав все возможные комбинации. Лучшим способом поиска оптимальных решений является изобретение Ньютона. Это производная или градиент, который показывает, как функция изменяет один из своих параметров и указывает в направлении увеличения функции.
Функция стоимости
Функция стоимости вычисляет разницу между предсказаниями модели (значением гипотезы) и фактическим набором данных в науке о данных. Точнее, это функция для вычисления значения, а стоимость относится к штрафу, который должен быть либо минимизирован, либо максимизирован, чтобы процесс обучения мог количественно определить ошибку и оптимизировать ее для уменьшения этой ошибки. Обычно используются среднеквадратическая ошибка (MSE), средняя абсолютная ошибка (MAE) и среднеквадратическая ошибка (RMSE).
Минимизация функции затрат
Градиентный спуск — это эффективный алгоритм оптимизации, который позволяет модели изучить градиент или направление, которое модель должна выбрать для уменьшения ошибок. В модели линейной регрессии процесс обучения настраивает параметры модели b0 и b1, чтобы уменьшить функцию стоимости. По мере повторения модели она постепенно сходится к минимуму, при котором дальнейшие настройки параметров приводят к незначительным или нулевым изменениям потерь, что также называется сходимостью. На этом этапе модель оптимизировала веса, и модель обучения готова прогнозировать будущий набор данных.
Сводка
В этом посте представлены основы машинного обучения. В машинном обучении можно охватить гораздо больше, но понимание этих основ помогает мне изучать более сложные модели.