Машинное обучение, взгляд с высоты птичьего полета:

Мы путешествуем на поезде под названием Мир, который движется с колесами под названием технология, по рельсам под названием Машинное обучение, Глубокое обучение, искусственный интеллект тратит секунды, минуты, часы на их изучение.

Машинное обучение играет ключевую роль во многих отраслях нашей повседневной жизни, где данные играют первостепенную роль. Это попытка помочь вам понять основные части машинного обучения.

Шесть банок машинного обучения:

Машинное обучение основано на том, чтобы заставить машину учиться на широком спектре данных. Машинное обучение в основном разделено на 6 элементов.

Когда я когда-либо сталкиваюсь со словом «машинное уклонение», которое напоминает мне о большом жаргоне тонких вещей, с которыми приходится иметь дело, мне приходит в голову Classification, BackPropogation, GadientDescent, Regression, Convolution Neural Network… .. И так далее… …

Разбиваем сложный жаргон на 6 основных банок:

1. ДАННЫЕ:

Данные - это ключевой элемент машинного обучения. Везде данные представлены в разных формах.

Данные в основном подразделяются на два типа: Структурированные данные и неструктурированные данные.

Данные… Данные… Данные… повсюду.

Изображение сбоку указывает разницу между структурированными и неструктурированными данными.

Пример: если мы возьмем веб-страницу продукта на Amazon, описание продукта будет в форме изображений, таблиц, абзацев, которые называются данными изображения, структурированными данными, текстовыми данными.

Данные в табличном формате называются структурированными данными, а данные в виде изображений, текста, аудио называются неструктурированными данными

Google Play Маркет также содержит данные различного типа, такие как данные изображения, текстовые данные, данные отзывов.

Facebook содержит все виды данных, такие как текстовые данные, данные изображений, видеоданные и все типы данных. Данные повсюду вокруг вас с вещами и в вещах, которые вы используете каждый день, возвращаясь.

Wynk, Saavn, Ganna и многие другие содержат другие типы данных, такие как аудиоданные и текстовые данные.

Сейчас дни машинного обучения, глубокого обучения и агентов ИИ, данные так же важны, как и сердцебиение: P

2. Задачи:

Задачи - это следующий этап после сбора данных по поиску различных наборов данных. После сбора данных что нам с этим делать? Мы должны это сделать. Это не значит, что мы можем применить машинное обучение ко всем типам данных. Это этап изучения данных, что делать ?.

Обучение без учителя: (кластеризация)

Генерация таких изображений из изображений или текста из текста в целом называется обучением без учителя. Наиболее распространенным методом обучения без учителя является кластерный анализ, который используется для исследовательского анализа данных с целью найти скрытые закономерности или группировку в данных.

Обучение с учителем: (регрессия / классификация)

Обучение с учителем - это тип машинного обучения, который позволяет модели предсказывать будущие результаты после обучения на основе прошлых данных.

Обучение с подкреплением:

Это своего рода обучение, при котором машина обучается выполнять конкретную задачу, она обучается самостоятельно в зависимости от своего предыдущего опыта и результатов, полученных ранее при выполнении определенного вида задачи.

3. модели:

Какова математическая формула задачи? для задачи мы сталкиваемся со всеми данными и обнаруживаем, что у нас всегда будет два значения x и y. У нас будет связь между x и y

Мы не будем знать, каково истинное отношение, но мы кое-как придумаем приблизительное соотношение на этом этапе.

Мы начнем изучение параметра, начиная с линейных функций, и мы даже изменим степень функции и попробуем, пока набор данных не удовлетворит все выходы в соответствии с требованиями.

Рядом находится окончательное решение функции степени 25, удовлетворяющее всем входным данным и генерирующее удовлетворительные выходные данные, и, наконец, мы получаем многочлен степени 25, начиная с линейного полинома с перетасовкой случайных весов. это как заставит машину учиться на данных.

Таким образом, инженер по машинному обучению придумывает функцию решения, в которой мы сталкиваемся с разными функциями, например, с функциями нейронной сети.

5. функция потерь:

Как мы узнаем, какая модель лучше? Каждый человек придумывает свою собственную функцию, удовлетворяющую результаты по-разному, откуда мы это знаем. Теперь нам становится понятна важность функции потерь.

Квадратная ошибка потери:

Функция потерь определяется как Квадрат разницы между истинным выходом и выходом модели, затем мы сравним все функции потерь для всех моделей, и затем какая модель имеет меньшие потери, будет объявлена как лучшая модель.

Квадрат разницы предназначен для того, чтобы избежать отрицательных и положительных различий значений (yf (x)), квадрат значений делает отрицательное значение положительным и складывает это значение, и мы получим самый точный проигрыш.

При расчете потерь также используются различные методы, как показано рядом с вышеупомянутым методом, который мы обсуждали в разделе «Потери при квадратичной ошибке».

Потеря перекрестной энтропии:

Потеря кросс-энтропии, или потеря журнала, измеряет производительность модели классификации, выходом которой является значение вероятности от 0 до 1. Потери перекрестной энтропии возрастают по мере того, как прогнозируемая вероятность отклоняется от фактической метки. Таким образом, прогнозирование вероятности 0,012, когда фактическая метка наблюдения равна 1, было бы плохим и привело бы к высокому значению потерь. У идеальной модели логарифм потери равен нулю.

5.Алгоритмы обучения:

Алгоритм обучения - это очень важный шаг, и здесь мы подходим к тому, чтобы заставить модель очень эффективно изучать значения в кратчайшие сроки, и нам также нужно, чтобы в этом случае потери для меня были минимизированы.

Имеет значение, насколько эффективно работает алгоритм, выбирает веса и минимизирует потери.

Пример: Пусть значения весов a, b, c

Здесь, когда машина вступает в дело, она находит значения a, b, c точно, эффективно и быстро.

6. оценка:

Оценка модели производится по некоторым метрикам. лучшие показатели

ТОП-3 точности:

Сравните первые результаты поиска, выданные Google. На самом деле в обобщенном виде мы сначала видим 3 первых или 5 первых результатов из 10–15, что дает нам полезный и актуальный. Этот показатель используется в классификации Image Net.

В отличие от функции потерь:

Одно из объяснений может заключаться в том, что результаты, которые мы даем в процентах, будут иметь больше смысла, чем те, которые даны в терминах значений функции потерь или около того.
Процентное соотношение дает точную общую производительность модели по сравнению с данными в хорошо показанной манере.

Наконец, со всеми этапами модели машинного обучения:

В конечном итоге мы узнаем много о машинном обучении, главном столпе, который является фундаментом здания, называемого машинным обучением.

смотрите также:

Новые материалы

Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…

Просто начните и учитесь самостоятельно Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..

Лицензии с открытым исходным кодом: руководство для разработчиков и создателей

В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning