В этой статье представлены типы машинного обучения и используемые методы.
Машинное обучение включает в себя показ большого объема данных машине, чтобы она могла учиться и делать прогнозы, находить закономерности или классифицировать данные. Три типа машинного обучения: контролируемое, неконтролируемое и обучение с подкреплением.
Эти алгоритмы машинного обучения помогают решать различные бизнес-задачи, такие как регрессия, классификация, прогнозирование, кластеризация, ассоциации и т. д.
Типы машинного обучения:
- контролируемое обучение
- неконтролируемое обучение
- обучение с подкреплением
Контролируемое обучение:
Обучение с учителем — это тип алгоритма машинного обучения, который включает обучение модели на размеченных данных. При обучении с учителем алгоритму предоставляется набор входных данных и соответствующих им выходных значений, известных как метки. Затем алгоритм учится сопоставлять входные данные с правильным выходным значением, обобщая помеченные примеры. Другими словами, алгоритм учится обобщать известные примеры, чтобы делать прогнозы относительно неизвестных примеров.
Цель контролируемого обучения — построить модель, которая может делать точные прогнозы на основе новых, невидимых данных. Для этого модель должна быть обучена на большом и разнообразном наборе данных, который хорошо представляет предметную область. Обучающие данные обычно разбиваются на два набора: обучающий набор и проверочный набор. Учебный набор используется для обучения модели, а проверочный набор используется для оценки производительности модели и настройки ее гиперпараметров.
Обучение с учителем можно разделить на два основных типа:
Классификация. В задачах классификации цель состоит в том, чтобы предсказать категориальный ярлык или класс для заданных входных данных. Например, классифицировать электронное письмо как спам или не спам или идентифицировать цифру на изображении. Общие алгоритмы, используемые для классификации, включают логистическую регрессию, деревья решений, случайные леса и машины опорных векторов.
Регрессия. В задачах регрессии цель состоит в том, чтобы предсказать непрерывное числовое значение для заданных входных данных. Например, прогнозирование цены дома на основе его характеристик, таких как расположение, размер и количество спален. Общие алгоритмы, используемые для регрессии, включают линейную регрессию, полиномиальную регрессию и нейронные сети.
Некоторые примеры алгоритмов обучения с учителем включают линейную регрессию, логистическую регрессию, деревья решений, случайные леса и нейронные сети. Эти алгоритмы можно использовать для широкого круга задач, таких как классификация, регрессия и предсказание последовательности.
Обучение под наблюдением имеет множество применений в различных отраслях, таких как здравоохранение, финансы, розничная торговля и производство. Он широко используется для таких задач, как распознавание изображений и речи, обработка естественного языка, рекомендательные системы и профилактическое обслуживание.
Обучение без учителя:
Неконтролируемое обучение — это тип машинного обучения, при котором алгоритму не предоставляются помеченные данные или конкретная задача для выполнения. Вместо этого алгоритм должен работать с неразмеченными данными и должен самостоятельно обнаруживать скрытые отношения и структуры внутри данных.
Алгоритм пытается найти основную структуру или распределение в данных, а затем группирует точки данных на основе их сходства или различия, что делает его методом «самообучения».
Целью неконтролируемого обучения является выявление скрытых закономерностей, взаимосвязей и структур в данных без получения каких-либо явных указаний или отзывов о том, что искать. Неконтролируемое обучение особенно полезно, когда размеченных данных мало или их получение дорого.
Неконтролируемое обучение обычно используется для группировки похожих точек данных вместе, уменьшения размерности данных и создания нового понимания данных. Его можно применять в различных областях, включая анализ данных, распознавание образов, обработку естественного языка и компьютерное зрение.
Некоторыми популярными алгоритмами, используемыми в неконтролируемом обучении, являются кластеризация (K-средние, иерархическая кластеризация и кластеризация на основе плотности), уменьшение размерности (анализ основных компонентов (PCA), t-SNE и автоэнкодеры), анализ правил ассоциации (априорные и FP- рост), обнаружение аномалий (SVM одного класса и фактор локального выброса), генеративные модели (VAE и GAN).
Приложения неконтролируемого обучения, такие как сегментация клиентов, анализ изображений и текста, обнаружение мошенничества и системы рекомендаций.
Обучение с подкреплением:
Обучение с подкреплением — это тип машинного обучения, который фокусируется на обучении агентов принимать решения на основе обратной связи, которую они получают из своей среды. При обучении с подкреплением агент взаимодействует со своей средой, совершая действия и получая вознаграждение или наказание в ответ на эти действия. Цель агента — изучить политику, которая со временем максимизирует его кумулятивное вознаграждение. Агент учится принимать лучшие решения с течением времени, обновляя свою политику на основе получаемых вознаграждений.
Агент взаимодействует со средой, выбирая действие в зависимости от своего текущего состояния. Затем среда реагирует, переходя в новое состояние и предоставляя вознаграждение или штраф агенту в зависимости от предпринятого действия. Агент учится улучшать свою политику принятия решений с течением времени, используя наблюдаемые вознаграждения и штрафы для обновления своей политики.
Ключевыми преимуществами обучения с подкреплением является его способность учиться на собственном опыте без необходимости использования уже существующих данных или явного программирования.
Обучение с подкреплением обычно используется в ситуациях, когда оптимальное решение неизвестно заранее, и агент должен учиться на собственном опыте путем проб и ошибок. Некоторые распространенные сценарии, в которых полезно обучение с подкреплением, - это робототехника и игры.
Некоторыми из наиболее часто используемых алгоритмов обучения с подкреплением являются Q-Learning, SARSA (состояние-действие-вознаграждение-состояние-действие) и глубокие Q-сети (DQN).
Приложениями обучения с подкреплением являются робототехника, игры, здравоохранение, реклама и автономные транспортные средства.
Вывод:
В этой статье мы рассмотрели типы машинного обучения, которые включают концепции обучения с учителем, без учителя и обучения с подкреплением, с некоторыми из наиболее часто используемых алгоритмов и приложений.
Это все люди!
Спасибо за прочтение!
Удачного обучения и счастливого роста всем нам :)