Мы путешествуем на поезде под названием Мир, который движется с колесами под названием технология, по рельсам под названием Машинное обучение, Глубокое обучение, искусственный интеллект тратит секунды, минуты, часы на их изучение.

Машинное обучение играет ключевую роль во многих отраслях нашей повседневной жизни, где данные играют первостепенную роль. Это попытка помочь вам понять основные части машинного обучения.

Шесть банок машинного обучения:

Машинное обучение основано на том, чтобы заставить машину учиться на широком спектре данных. Машинное обучение в основном разделено на 6 элементов.

Когда я когда-либо сталкиваюсь со словом «машинное уклонение», которое напоминает мне о большом жаргоне тонких вещей, с которыми приходится иметь дело, мне приходит в голову Classification, BackPropogation, GadientDescent, Regression, Convolution Neural Network… .. И так далее… …

Разбиваем сложный жаргон на 6 основных банок:

1. ДАННЫЕ:

Данные - это ключевой элемент машинного обучения. Везде данные представлены в разных формах.

Данные в основном подразделяются на два типа: Структурированные данные и неструктурированные данные.

Данные… Данные… Данные… повсюду.

Изображение сбоку указывает разницу между структурированными и неструктурированными данными.

Пример: если мы возьмем веб-страницу продукта на Amazon, описание продукта будет в форме изображений, таблиц, абзацев, которые называются данными изображения, структурированными данными, текстовыми данными.

Данные в табличном формате называются структурированными данными, а данные в виде изображений, текста, аудио называются неструктурированными данными

Google Play Маркет также содержит данные различного типа, такие как данные изображения, текстовые данные, данные отзывов.

Facebook содержит все виды данных, такие как текстовые данные, данные изображений, видеоданные и все типы данных. Данные повсюду вокруг вас с вещами и в вещах, которые вы используете каждый день, возвращаясь.

Wynk, Saavn, Ganna и многие другие содержат другие типы данных, такие как аудиоданные и текстовые данные.

Сейчас дни машинного обучения, глубокого обучения и агентов ИИ, данные так же важны, как и сердцебиение: P

2. Задачи:

Задачи - это следующий этап после сбора данных по поиску различных наборов данных. После сбора данных что нам с этим делать? Мы должны это сделать. Это не значит, что мы можем применить машинное обучение ко всем типам данных. Это этап изучения данных, что делать ?.

Обучение без учителя: (кластеризация)

Генерация таких изображений из изображений или текста из текста в целом называется обучением без учителя. Наиболее распространенным методом обучения без учителя является кластерный анализ, который используется для исследовательского анализа данных с целью найти скрытые закономерности или группировку в данных.

Обучение с учителем: (регрессия / классификация)

Обучение с учителем - это тип машинного обучения, который позволяет модели предсказывать будущие результаты после обучения на основе прошлых данных.

Обучение с подкреплением:

Это своего рода обучение, при котором машина обучается выполнять конкретную задачу, она обучается самостоятельно в зависимости от своего предыдущего опыта и результатов, полученных ранее при выполнении определенного вида задачи.

3. модели:

Какова математическая формула задачи? для задачи мы сталкиваемся со всеми данными и обнаруживаем, что у нас всегда будет два значения x и y. У нас будет связь между x и y

Мы не будем знать, каково истинное отношение, но мы кое-как придумаем приблизительное соотношение на этом этапе.

Мы начнем изучение параметра, начиная с линейных функций, и мы даже изменим степень функции и попробуем, пока набор данных не удовлетворит все выходы в соответствии с требованиями.

Рядом находится окончательное решение функции степени 25, удовлетворяющее всем входным данным и генерирующее удовлетворительные выходные данные, и, наконец, мы получаем многочлен степени 25, начиная с линейного полинома с перетасовкой случайных весов. это как заставит машину учиться на данных.

Таким образом, инженер по машинному обучению придумывает функцию решения, в которой мы сталкиваемся с разными функциями, например, с функциями нейронной сети.

5. функция потерь:

Как мы узнаем, какая модель лучше? Каждый человек придумывает свою собственную функцию, удовлетворяющую результаты по-разному, откуда мы это знаем. Теперь нам становится понятна важность функции потерь.

Квадратная ошибка потери:

Функция потерь определяется как Квадрат разницы между истинным выходом и выходом модели, затем мы сравним все функции потерь для всех моделей, и затем какая модель имеет меньшие потери, будет объявлена ​​как лучшая модель.

Квадрат разницы предназначен для того, чтобы избежать отрицательных и положительных различий значений (yf (x)), квадрат значений делает отрицательное значение положительным и складывает это значение, и мы получим самый точный проигрыш.

При расчете потерь также используются различные методы, как показано рядом с вышеупомянутым методом, который мы обсуждали в разделе «Потери при квадратичной ошибке».

Потеря перекрестной энтропии:

Потеря кросс-энтропии, или потеря журнала, измеряет производительность модели классификации, выходом которой является значение вероятности от 0 до 1. Потери перекрестной энтропии возрастают по мере того, как прогнозируемая вероятность отклоняется от фактической метки. Таким образом, прогнозирование вероятности 0,012, когда фактическая метка наблюдения равна 1, было бы плохим и привело бы к высокому значению потерь. У идеальной модели логарифм потери равен нулю.

5.Алгоритмы обучения:

Алгоритм обучения - это очень важный шаг, и здесь мы подходим к тому, чтобы заставить модель очень эффективно изучать значения в кратчайшие сроки, и нам также нужно, чтобы в этом случае потери для меня были минимизированы.

Имеет значение, насколько эффективно работает алгоритм, выбирает веса и минимизирует потери.

Пример: Пусть значения весов a, b, c

Здесь, когда машина вступает в дело, она находит значения a, b, c точно, эффективно и быстро.

6. оценка:

Оценка модели производится по некоторым метрикам. лучшие показатели

ТОП-3 точности:

Сравните первые результаты поиска, выданные Google. На самом деле в обобщенном виде мы сначала видим 3 первых или 5 первых результатов из 10–15, что дает нам полезный и актуальный. Этот показатель используется в классификации Image Net.

В отличие от функции потерь:

  1. Одно из объяснений может заключаться в том, что результаты, которые мы даем в процентах, будут иметь больше смысла, чем те, которые даны в терминах значений функции потерь или около того.
  2. Процентное соотношение дает точную общую производительность модели по сравнению с данными в хорошо показанной манере.

Наконец, со всеми этапами модели машинного обучения:

В конечном итоге мы узнаем много о машинном обучении, главном столпе, который является фундаментом здания, называемого машинным обучением.