Согласно научному определению, машинное обучение — это изучение компьютерных алгоритмов, которые совершенствуются благодаря опыту. Что буквально означает слово машинное обучение? Означает ли это установку возможностей обучения на машине? Да, это сценарий, в котором мы обучаем и разрабатываем модель машинного обучения. Основная цель машинного обучения — имитировать интеллект машин, чтобы он мог обнаруживать и помогать решать реальные проблемы.
Базовый механизм построения модели машинного обучения заключается в обучении нашей модели уже существующим данным и разработке идей на основе этих данных, чтобы наша вновь обученная модель была готова предсказывать будущие значения. В общем, алгоритм структуры данных имеет предварительно построенные правила, предоставляемые пользовательским вводом, он генерирует выходные данные. В то время как алгоритм машинного обучения имеет входные данные и соответствующие им выходные данные и, в свою очередь, генерирует правила для этой модели.
ТИПЫ ДАННЫХ:
Данные существуют в двух формах: структурированные и неструктурированные данные. Структурированные данные — это данные, которые имеют четко определенную структуру, следуют определенному порядку и могут быть легко доступны конечному пользователю. Неструктурированные данные — это данные, которые плохо организованы или четко определены.
Структурированные данные:
- Данные с четко определенной структурой
2. Пример: табличные данные
3. Можно легко получить доступ
4. Легко найти
5. Применение: бронирование авиабилетов
Неструктурированные данные:
- Данные без четко определенного формата
2. Пример: текстовые файлы, видео, изображения.
3. Не может быть легко доступен
4. Не легко найти
5. Приложения: спутниковые снимки
КАТЕГОРИИ МАШИННОГО ОБУЧЕНИЯ:
Машинное обучение можно разделить на 5 категорий, а именно:
• Обучение с учителем : в этом случае алгоритм машинного обучения получает данные и строит модель .
• Неконтролируемое обучение: в этом случае машина создает модель самостоятельно, без каких-либо данных от пользователя.
• Обучение с подкреплением: похоже на игровую ситуацию. Это сценарий, в котором компьютер методом проб и ошибок находит решение проблемы. Для игры или модели без подсказок она начинается со случайных следов и развивается в модель с типичной тактикой и мастерским человеческим интеллектом.
• Глубокое обучение. В этом случае искусственные нейронные сети, алгоритмы, вдохновленные человеческим мозгом, обучаются и извлекают ценную информацию из большого объема данных. Это называется «глубоким обучением», потому что нейронные сети имеют различные уровни, которые позволяют обучаться.
- Глубокое обучение с подкреплением. Для создания эффективных алгоритмов используется как обучение с подкреплением, так и глубокое обучение.
ВИДЫ КОНТРОЛЬНОГО ОБУЧЕНИЯ:
Обучение под наблюдением можно разделить на два типа, а именно алгоритмы регрессии и классификации.
Алгоритм классификации:
- Линейные классификаторы
Наивный байесовский классификатор
Линейный дискриминант Фишера
• Машина опорных векторов
• Квадратичные классификаторы
• Оценка ядра
k-ближайший сосед
• Деревья решений
Случайный лес
- Нейронная сеть
Алгоритм регрессии:
- Линейная регрессия
- Логистическая регрессия
- Мультилинейная регрессия
- Полиномиальная регрессия
Чтобы было предельно ясно, классификация предназначена для предсказания метки, а регрессия – для предсказания количества.