Машинное обучение является последним в длинной череде попыток преобразовать человеческие знания и рассуждения в форму, пригодную для создания машин и инженерных автоматизированных систем. По мере того, как машинное обучение становится все более распространенным, а его программные пакеты становятся проще в использовании, естественно и желательно, чтобы низкоуровневые технические детали были абстрагированы и скрыты от практикующего специалиста. В Python и R доступно множество библиотек для построения моделей. Итак, возникает вопрос: Какой смысл в изучении математики для использования машинного обучения?

Эта статья представляет собой руководство для начинающих, в котором рассказывается о важности математики и ее использовании в области науки о данных и машинного обучения.

Почему математика важна в машинном обучении?

Машинное обучение опирается на язык математики для выражения понятий, которые кажутся интуитивно очевидными, но которые на удивление трудно формализовать. После правильной формализации мы можем получить представление о задаче, которую хотим решить. Одна из распространенных жалоб студентов-математиков во всем мире заключается в том, что рассматриваемые темы, по-видимому, имеют мало отношения к практическим задачам. Мы считаем, что машинное обучение — это очевидная и прямая мотивация людей изучать математику.

Математика в науке о данных и машинном обучении связана не с обработкой чисел, а с тем, что происходит, почему это происходит и как мы можем экспериментировать с разными вещами, чтобы получить нужные результаты.

Машинное обучение — это разработка алгоритмов, которые автоматически извлекают ценную информацию из данных. Поскольку машинное обучение по своей сути основано на данных, данные лежат в основе машинного обучения. Цель машинного обучения — разработать методологии общего назначения для извлечения ценных шаблонов из данных. Математические основы машинного обучения важны для понимания фундаментальных принципов, на которых строятся более сложные системы машинного обучения. Понимание этих принципов может облегчить создание новых решений для машинного обучения, понимание и отладку существующих подходов, а также изучение неотъемлемых допущений и ограничений методологий, с которыми мы работаем.

Разница между математикой машинного обучения и наукой о данных

Хотя наука о данных и машинное обучение имеют много общего, в их фокусе на математике есть тонкие различия. На приведенном ниже графике радара показана точка:

Да, наука о данных и машинное обучение во многом пересекаются, но они немного отличаются по своей основной направленности.

В науке о данных наша основная цель — исследовать и анализировать данные, генерировать гипотезы и проверять их. Часто это шаги для выявления скрытых выводов в данных, которые могут быть незаметны на первый взгляд. В результате мы должны строго полагаться на концепции статистики и вероятности для сравнения и проведения проверки гипотез.

С другой стороны, машинное обучение больше фокусируется на концепциях линейной алгебры, поскольку оно служит основным этапом для всех сложных процессов (помимо аспекта эффективности). С другой стороны, многомерное исчисление связано с аспектом численной оптимизации, которая является движущей силой большинства алгоритмов машинного обучения.

Теперь давайте обсудим некоторые основные математические концепции, используемые в машинном обучении.

Линейная алгебра

Линейная алгебра — это систематическое представление знаний, которые может понять компьютер, и все операции в линейной алгебре — это систематические правила.

линейная алгебра является основой машинного обучения и науки о данных, которые в ближайшие годы произведут революцию во всех остальных отраслях. линейная алгебра действует как сцена или платформа, на которой все алгоритмы машинного обучения обрабатывают свои результаты. Использование матриц и векторов помогает представлять различные данные. Использование структур линейной алгебры при работе с данными, такими как наборы табличных данных и изображения.

некоторые примеры линейной алгебры в машинном обучении:

1. Набор данных и файлы данных

В машинном обучении вы подгоняете модель к набору данных. Для табличного набора чисел, где каждая строка представляет наблюдение, а каждый столбец представляет собой характеристику наблюдения. data на самом деле является матрицей: ключевой структурой данных в линейной алгебре. вектор — еще одна ключевая структура данных в линейной алгебре.

2. Изображения и фотографии

Возможно, мы больше привыкли работать с изображениями или фотографиями в приложениях компьютерного зрения. Каждое изображение, с которым мы работаем, само по себе является структурой таблицы с шириной и высотой и значением в один пиксель в каждой ячейке для черно-белых изображений или значениями в 3 пикселя в каждой ячейке для цветного изображения. Фотография — еще один пример матрицы из линейной алгебры. Операции с изображением, такие как обрезка, масштабирование, обрезка и т. д., описываются с использованием обозначений и операций линейной алгебры.

3. Одно горячее кодирование

Иногда мы работаем с категориальными данными в машинном обучении. Возможно, метки классов для задач классификации или, возможно, категориальные входные переменные. Обычно категориальные переменные кодируют, чтобы упростить работу с ними и их изучение с помощью некоторых методов. Популярным кодированием категориальных переменных является одно горячее кодирование. В одном горячем кодировании создается таблица для представления переменной с одним столбцом для каждой категории и строкой для каждого примера в наборе данных. Проверка или одно значение добавляется в столбец для категориального значения для данной строки, а нулевое значение добавляется ко всем остальным столбцам.

4. Рекомендательные системы

Проблемы прогнозного моделирования, связанные с рекомендацией продуктов, называются рекомендательными системами, подобластью машинного обучения. Примеры включают рекомендацию книг на основе предыдущих покупок и покупок таких клиентов, как вы, на Amazon, а также рекомендацию фильмов и телепередач для просмотра на основе вашей истории просмотров и истории просмотров подписчиков, таких как вы, на Netflix. Разработка рекомендательных систем в первую очередь связана с методами линейной алгебры. Простым примером является расчет сходства между разреженными векторами поведения клиентов с использованием мер расстояния, таких как евклидово расстояние или скалярные произведения.

Исчисление

Многомерное исчисление, или, если точнее, частичное дифференцирование, используется для математической оптимизации заданнойфункции (чаще всего выпуклой).

Исчисление — это абстрактная теория, разработанная чисто формально. Исчисление, более правильно называемое анализом, представляет собой раздел математики, изучающий скорость изменения величин (которые можно интерпретировать как наклоны кривых), а также длину, площадь и объем объектов.

Машинное обучение использует производные в задачах оптимизации. Алгоритмы оптимизации, такие как градиентный спуск, используют производные, чтобы решить, увеличивать или уменьшать веса, чтобы максимизировать или минимизировать некоторую цель (например, точность модели или функции ошибок). Производные также помогают нам аппроксимировать нелинейные функции как линейные функции (касательные линии), которые имеют постоянный наклон. С постоянным наклоном мы можем решить, двигаться ли вверх или вниз по наклону (увеличивать или уменьшать наши веса), чтобы приблизиться к целевому значению (метка класса).

пример линейной алгебры в машинном обучении:

Предположим, мы пытаемся спрогнозировать переменную, которая зависит от нескольких переменных. Переменная, которую мы прогнозируем, является непрерывной переменной, например. ежемесячное количество осадков и зависит от ряда переменных, например. температура, скорость ветра и так далее. Мы решили использовать алгоритм линейной регрессии. Наша единственная цель в линейной регрессии — как можно точнее подобрать фактические значения. Мы количественно определяем разницу между прогнозируемыми и фактическими значениями, используя функцию потерь (или затрат). Эта функция потерь может быть основана на алгоритмах среднеквадратичной ошибки или среднеквадратичной ошибки. Мы собираемся повторять упражнение до тех пор, пока функция потерь не сойдется и мы не достигнем минимального значения. Когда алгоритм достигает своей цели, он называется сходящимся. Это достигается за счет использования алгоритма градиентного спуска, который внутренне зависит от методов многомерного частичного исчисления.

Вероятность

Понятия вероятности, необходимые для машинного обучения, элементарны (в основном), но все же требуют интуиции. Он часто используется в виде распределений, таких как распределения Бернулли, распределение Гаусса, функция плотности вероятности и функция кумулятивной плотности. Мы используем их для проверки гипотез, где понимание вероятности очень важно.

пример вероятности в машинном обучении:

Вероятность используется в машинном обучении разными способами. Простым примером может быть использование логистической регрессии для классификации изображений. При этом мы используем функцию argmax, которая в основном вычисляет вероятность того, что данное изображение принадлежит к определенному классу изображений, скажем, у меня есть изображение самолета, и моя модель решает, что вероятность того, что это самолет, составляет 80%, 10 % вероятность того, что это здание и 10% вероятность, что это кошка. В этом случае изображение будет классифицироваться как изображение самолета, потому что это то, что предсказала модель с наибольшим значением p.

Статистика

Машинное обучение — это не только построение прогностических моделей, но и извлечение как можно большего количества информации из имеющихся данных с помощью доступных нам статистических инструментов.

Статистика обычно считается необходимым условием для прикладного машинного обучения. Нам нужна статистика, чтобы помочь преобразовать наблюдения в информацию и ответить на вопросы о выборках наблюдений. Статистика — это набор инструментов, разработанных за сотни лет для обобщения данных и количественной оценки свойств предметной области с учетом выборки наблюдений.

пример статистики в машинном обучении:

  • Исследовательский анализ данных, обобщение данных и визуализация данных могут помочь сформулировать проблему прогнозного моделирования и лучше понять данные.
  • Эти статистические методы можно использовать для очистки и подготовки данных, готовых к моделированию.
  • Эти статистические проверки гипотез и статистические оценки могут помочь в выборе модели и в представлении навыков и прогнозов на основе окончательных моделей.

Вывод

Математика для машинного обучения — важный аспект, который часто упускается из виду или рассматривается с неправильной точки зрения. В этой статье мы обсудили различия между математикой, необходимой для науки о данных, и машинным обучением. Мы также узнали некоторые подсказки о том, почему и где нам нужна математика в этой области.