Основы машинного обучения

В этом посте я кратко расскажу, объясняя основы того, что такое машинное обучение и модель обучения.

Что такое машинное обучение?

Оксфордский словарь определяет машинное обучение как:

«Способность компьютера учиться на собственном опыте»

Машинное обучение направлено на разработку алгоритмов, которые могут научиться выполнять конкретную задачу на основе данных примера. Вот пример. Допустим, мы хотим написать программу для игры. Мы могли бы написать эту программу, вручную определив правила игры. Мы могли бы запрограммировать некоторые стратегии открытия и правила принятия решений. Но есть проблема. Этот подход может быстро усложниться, если вы программируете эти правила вручную. Лучшим решением является создание алгоритмов машинного обучения. Машинное обучение может научиться играть в игру на основе примеров и опыта, как и люди.

Модели обучения

Модель обучения может различаться в зависимости от наборов данных и сферы деятельности, но, говоря простым языком, модель изучает функцию f, как принимать X (т. е. функции или независимые переменные для прогнозирования y. Например, если я обучаю модель на основе набора данных о свойствах, включая размер дома (X) и цену продажи (y), я мог бы оценить цену другого объекта, используя аналогичные данные о жилье.

Я буду использовать простую модель линейной регрессии, чтобы объяснить два основных параметра обучения ML(функция стоимости) и минимизировать функцию стоимости (градиентный спуск). Хотя линейная регрессия не является самой мощной моделью в ML, она проста для понимания и является одной из наиболее широко используемых моделей для оценки линейных отношений между двумя или более непрерывными и/или категориальными данными и непрерывной выходной переменной.

Учебные модели используют помеченные данные, настраиваемые параметры и алгоритм оптимизации для определения модели. Алгоритм оптимизации пытается найти наилучшую комбинацию параметров, чтобы в примере x выход модели y максимально приближен к ожидаемому результату. Типичные модели машинного обучения имеют тысячи или миллионы параметров, поэтому невозможно найти выходные данные y модели f для входных данных x, перепробовав все возможные комбинации. Лучшим способом поиска оптимальных решений является изобретение Ньютона. Это производная или градиент, который показывает, как функция изменяет один из своих параметров и указывает в направлении увеличения функции.

Функция стоимости

Функция стоимости вычисляет разницу между предсказаниями модели (значением гипотезы) и фактическим набором данных в науке о данных. Точнее, это функция для вычисления значения, а стоимость относится к штрафу, который должен быть либо минимизирован, либо максимизирован, чтобы процесс обучения мог количественно определить ошибку и оптимизировать ее для уменьшения этой ошибки. Обычно используются среднеквадратическая ошибка (MSE), средняя абсолютная ошибка (MAE) и среднеквадратическая ошибка (RMSE).

Минимизация функции затрат

Градиентный спуск — это эффективный алгоритм оптимизации, который позволяет модели изучить градиент или направление, которое модель должна выбрать для уменьшения ошибок. В модели линейной регрессии процесс обучения настраивает параметры модели b0 и b1, чтобы уменьшить функцию стоимости. По мере повторения модели она постепенно сходится к минимуму, при котором дальнейшие настройки параметров приводят к незначительным или нулевым изменениям потерь, что также называется сходимостью. На этом этапе модель оптимизировала веса, и модель обучения готова прогнозировать будущий набор данных.

Сводка

В этом посте представлены основы машинного обучения. В машинном обучении можно охватить гораздо больше, но понимание этих основ помогает мне изучать более сложные модели.

смотрите также:

Новые материалы

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

ИИ в аэрокосмической отрасли

Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Data Visualization Neural Networks Startup Tutorial Statistics Productivity Reactjs Learning