Мы уже говорили об искусственном интеллекте и о том, как сильно он развивается.
За всеми этими разработками стоит множество программ и данных. Для некоторых это может показаться скучным, но самое интересное — самые популярные алгоритмы довольно просты для понимания.
Для построения концепции…
Сложные системы обычно имеют базовые правила, поддерживающие их.
Вот самые популярные алгоритмы машинного обучения:
Итак, мы возьмем четыре сверху. Не только из-за популярности, но и из-за того, что они связаны друг с другом. Они относятся к контролируемому машинному обучению.
Один — линейная регрессия.
Этот алгоритм машинного обучения является самым простым для понимания. Линейная регрессия, также используемая в статистике, объединяет две переменные. Где одна считается независимой переменной, а другая — зависимой.
Для моделирования важно понять, есть ли какая-либо связь между переменными, чтобы отобразить некоторую корреляцию.
Корреляция не означает причинно-следственную связь
Закономерности и графики времени. Например, вы хотите понять, какой вес вы наберете в зависимости от потребляемых вами калорий и пищи, которую вы едите. Вам даны следующие данные:
Однако вы хотите знать, какой вес (ось Y) вы наберете, если потребляете 2500 калорий (ось X). Во-первых, вы нарисуете точечную диаграмму данных, чтобы визуализировать их. Затем вы представите прямую линию, проведенную рядом с каждой точкой данных на графике, например:
Простой:
Менее простой
(С совершенно другим набором данных):
Что вы можете сделать с линейной регрессией?
- Для прогнозной аналитики
- Для прогнозирования продаж
- Чтобы узнать о тенденциях
- Чтобы узнать, как температура в офисе влияет на общую производительность
- Чтобы узнать, как бизнес-доступность влияет на продажи
- Чтобы узнать, как потребление пищи влияет на здоровье
- Чтобы узнать, как окупаются инвестиции в маркетинг
- И т. д.
Следует помнить, что линейная регрессия не заботится о классификации. Вот почему мы переходим к алгоритму машинного обучения номер 2.
Два — Логистическая регрессия
Этот алгоритм машинного обучения примерно
Классификация, упорядочивание, рейтинг, категоризация, группировка.
Это алгоритм классификации, используемый для прогнозирования категориальной зависимой переменной с использованием заданного набора независимых переменных. В зависимости от количества переменных рассмотрим два типа:
Биномиальный: может быть только два возможных типа переменных. Или: спам или не спам, опухоль злокачественная или доброкачественная.
Хорошее визуальное представление биномиальной классификации
Где непрерывная классификация позволяет классифицировать опухоли от неопасных до опасных в зависимости от их размера. Или…
Чем меньше опухоль — тем менее опасна… И чем больше опухоль — тем опаснее она становится. Такой здравый смысл отображает биномиальную классификацию, используемую в машинном обучении.
Многочлен: может быть более двух возможных типов переменных. Или: маленький, средний или большой
Хорошим визуальным представлением будет
Где биномиальные и полиномиальные отображают свои различия.
Что можно сделать с помощью логистической регрессии?
- Для решения проблем с классификацией
- Научить системы определять, является ли письмо спамом или нет.
- Чтобы сгруппировать вхождение определенных слов
- Чтобы измерить показатель успеха по соотношению выигрышей и проигрышей
- Чтобы выполнить анализ тональности по словам
- Чтобы классифицировать людей по доходу/семейному положению или почтовому индексу…
- Чтобы структурировать свое время
- И т. д.
Три — Дерево решений
Этот алгоритм машинного обучения примерно
Классификация, упорядочивание, рейтинг, категоризация, группировка.
+
принятие решений путем изучения и применения простых правил принятия решений.
Дерево можно объяснить двумя объектами, а именно узлами решений и листьями. Листья — это решения, результаты или конечные узлы. А узлы решений указывают на шаг, на котором должно быть принято решение.
Смущенный?
Хорошее визуальное представление:
В этом дереве вы заметите, что если вам дали ситуацию принять предложение о работе, вы пройдете через узлы принятия решений. Практически блок-схема для принятия решений.
Деревья решений популярны в аналитике данных и машинном обучении с практическими приложениями в различных секторах, от здравоохранения до финансов и технологий.
Что можно сделать с деревьями решений?
- Действовать на основе информации, полученной с помощью линейной или логистической регрессии
- Принимать стратегические решения
- Принимать оперативные решения
- Решите, покупать или нет
- Решите, участвовать в вечеринке или нет
- Решите, делать это или нет
- Решите, работать вам или нет
- И т. д..
Четыре — Случайный лес
Этот алгоритм машинного обучения примерно
Поместите одно дерево решений рядом с другим, чтобы получился лес.
+
Делая множество выводов из деревьев решений, чтобы извлечь окончательный вариант.
Хорошее визуальное представление для понимания случайного леса. Портрет этого алгоритма машинного обучения:
Он строится из группы деревьев решений и используется для решения задач как регрессии, так и классификации.
«Лес» обучается с помощью бэггинга (мета-алгоритма ансамбля, который повышает точность машинного обучения) или агрегации начальной загрузки.
Вот как это работает:
Где сначала вы получаете данные для обучения. Затем вы принимаете мини-решения. И после этого он принимает окончательное решение как «среднее» всех мини-решений, поступающих из деревьев решений.
Алгоритм устанавливает результат на основе прогнозов деревьев решений, взяв средний или средний результат из различных деревьев.
Чем больше деревьев, тем точнее результат.
Деревья решений по сравнению со случайными лесами проще, потому что они объединяют только некоторые из них, тогда как случайный лес объединяет много деревьев решений.
Деревья решений создаются быстрее и легко работают даже с большим набором данных. Однако, если вам нужен более стабильный и надежный прогноз, лучше всего использовать строгий случайный лес.
Алгоритм случайного леса применялся в нескольких отраслях, таких как финансы, здравоохранение и электронная коммерция.
Что вы можете сделать со случайными лесами?
- Для прогнозной аналитики
- Чтобы рекомендовать фильмы для просмотра
- Чтобы посоветовать, в какие акции инвестировать
- Чтобы предложить, какой смартфон купить
- Чтобы предсказать качество вина
- Прогноз погоды
- Чтобы измерить потенциальную реакцию рынка на запуск нового продукта
- И т. д.
Спасибо, что дочитали до конца. Если вам понравилась эта статья, поделитесь ею или похлопайте, чтобы другие тоже могли найти эту статью.
Запланируйте сеанс DDIChat в разделе Наука о данных / AI / ML / DL:
Подайте заявку на участие в DDIChat Expert здесь.
Способы работы с DDI: https://datadriveninvestor.com/collaborate
Посетите нас на https://www.datadriveninvestor.com/
Получите доступ к экспертному представлению — подпишитесь на DDI Intel: https://ddintel.datadriveninvestor.com/