Объяснение самых популярных алгоритмов машинного обучения

Мы уже говорили об искусственном интеллекте и о том, как сильно он развивается.

Заметные достижения ИИ за последнее десятилетие
Рост искусственного интеллекта пугает многих людей, которые склонны думать, что в будущем мы увидим роботов… media.datadriveninvestor.com

За всеми этими разработками стоит множество программ и данных. Для некоторых это может показаться скучным, но самое интересное — самые популярные алгоритмы довольно просты для понимания.

Для построения концепции…

Сложные системы обычно имеют базовые правила, поддерживающие их.

Вот самые популярные алгоритмы машинного обучения:

Итак, мы возьмем четыре сверху. Не только из-за популярности, но и из-за того, что они связаны друг с другом. Они относятся к контролируемому машинному обучению.

Один — линейная регрессия.

Этот алгоритм машинного обучения является самым простым для понимания. Линейная регрессия, также используемая в статистике, объединяет две переменные. Где одна считается независимой переменной, а другая — зависимой.

Для моделирования важно понять, есть ли какая-либо связь между переменными, чтобы отобразить некоторую корреляцию.

Корреляция не означает причинно-следственную связь

Закономерности и графики времени. Например, вы хотите понять, какой вес вы наберете в зависимости от потребляемых вами калорий и пищи, которую вы едите. Вам даны следующие данные:

Однако вы хотите знать, какой вес (ось Y) вы наберете, если потребляете 2500 калорий (ось X). Во-первых, вы нарисуете точечную диаграмму данных, чтобы визуализировать их. Затем вы представите прямую линию, проведенную рядом с каждой точкой данных на графике, например:

Простой:

Менее простой

(С совершенно другим набором данных):

Что вы можете сделать с линейной регрессией?

Для прогнозной аналитики
Для прогнозирования продаж
Чтобы узнать о тенденциях
Чтобы узнать, как температура в офисе влияет на общую производительность
Чтобы узнать, как бизнес-доступность влияет на продажи
Чтобы узнать, как потребление пищи влияет на здоровье
Чтобы узнать, как окупаются инвестиции в маркетинг
И т. д.

Следует помнить, что линейная регрессия не заботится о классификации. Вот почему мы переходим к алгоритму машинного обучения номер 2.

Два — Логистическая регрессия

Этот алгоритм машинного обучения примерно

Классификация, упорядочивание, рейтинг, категоризация, группировка.

Это алгоритм классификации, используемый для прогнозирования категориальной зависимой переменной с использованием заданного набора независимых переменных. В зависимости от количества переменных рассмотрим два типа:

Биномиальный: может быть только два возможных типа переменных. Или: спам или не спам, опухоль злокачественная или доброкачественная.

Хорошее визуальное представление биномиальной классификации

Где непрерывная классификация позволяет классифицировать опухоли от неопасных до опасных в зависимости от их размера. Или…

Чем меньше опухоль — тем менее опасна… И чем больше опухоль — тем опаснее она становится. Такой здравый смысл отображает биномиальную классификацию, используемую в машинном обучении.

Многочлен: может быть более двух возможных типов переменных. Или: маленький, средний или большой

Хорошим визуальным представлением будет

Где биномиальные и полиномиальные отображают свои различия.

Что можно сделать с помощью логистической регрессии?

Для решения проблем с классификацией
Научить системы определять, является ли письмо спамом или нет.
Чтобы сгруппировать вхождение определенных слов
Чтобы измерить показатель успеха по соотношению выигрышей и проигрышей
Чтобы выполнить анализ тональности по словам
Чтобы классифицировать людей по доходу/семейному положению или почтовому индексу…
Чтобы структурировать свое время
И т. д.

Три — Дерево решений

Этот алгоритм машинного обучения примерно

Классификация, упорядочивание, рейтинг, категоризация, группировка.

+

принятие решений путем изучения и применения простых правил принятия решений.

Дерево можно объяснить двумя объектами, а именно узлами решений и листьями. Листья — это решения, результаты или конечные узлы. А узлы решений указывают на шаг, на котором должно быть принято решение.

Смущенный?

Хорошее визуальное представление:

В этом дереве вы заметите, что если вам дали ситуацию принять предложение о работе, вы пройдете через узлы принятия решений. Практически блок-схема для принятия решений.

Деревья решений популярны в аналитике данных и машинном обучении с практическими приложениями в различных секторах, от здравоохранения до финансов и технологий.

Что можно сделать с деревьями решений?

Действовать на основе информации, полученной с помощью линейной или логистической регрессии
Принимать стратегические решения
Принимать оперативные решения
Решите, покупать или нет
Решите, участвовать в вечеринке или нет
Решите, делать это или нет
Решите, работать вам или нет
И т. д..

Четыре — Случайный лес

Этот алгоритм машинного обучения примерно

Поместите одно дерево решений рядом с другим, чтобы получился лес.

+

Делая множество выводов из деревьев решений, чтобы извлечь окончательный вариант.

Хорошее визуальное представление для понимания случайного леса. Портрет этого алгоритма машинного обучения:

Он строится из группы деревьев решений и используется для решения задач как регрессии, так и классификации.

«Лес» обучается с помощью бэггинга (мета-алгоритма ансамбля, который повышает точность машинного обучения) или агрегации начальной загрузки.

Вот как это работает:

Где сначала вы получаете данные для обучения. Затем вы принимаете мини-решения. И после этого он принимает окончательное решение как «среднее» всех мини-решений, поступающих из деревьев решений.

Алгоритм устанавливает результат на основе прогнозов деревьев решений, взяв средний или средний результат из различных деревьев.

Чем больше деревьев, тем точнее результат.

Деревья решений по сравнению со случайными лесами проще, потому что они объединяют только некоторые из них, тогда как случайный лес объединяет много деревьев решений.

Деревья решений создаются быстрее и легко работают даже с большим набором данных. Однако, если вам нужен более стабильный и надежный прогноз, лучше всего использовать строгий случайный лес.

Алгоритм случайного леса применялся в нескольких отраслях, таких как финансы, здравоохранение и электронная коммерция.

Что вы можете сделать со случайными лесами?

Для прогнозной аналитики
Чтобы рекомендовать фильмы для просмотра
Чтобы посоветовать, в какие акции инвестировать
Чтобы предложить, какой смартфон купить
Чтобы предсказать качество вина
Прогноз погоды
Чтобы измерить потенциальную реакцию рынка на запуск нового продукта
И т. д.

Спасибо, что дочитали до конца. Если вам понравилась эта статья, поделитесь ею или похлопайте, чтобы другие тоже могли найти эту статью.

Запланируйте сеанс DDIChat в разделе Наука о данных / AI / ML / DL:

Эксперты — Data Science / AI / ML / DL — DDIChat
DDIChat позволяет частным лицам и компаниям напрямую общаться с экспертами в предметной области. Это ускоряет консультации…app.ddichat.com

Подайте заявку на участие в DDIChat Expert здесь.
Способы работы с DDI: https://datadriveninvestor.com/collaborate
Посетите нас на https://www.datadriveninvestor.com/
Получите доступ к экспертному представлению — подпишитесь на DDI Intel: https://ddintel.datadriveninvestor.com/

смотрите также:

Новые материалы

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning