Экспертная система - это часть программного обеспечения, которое использует базы данных экспертных знаний для предоставления рекомендаций или принятия решений в таких областях, как медицинская диагностика.

Пример. Предположим, вы страдаете какой-то болезнью и посетили врача. На основании симптомов вашего заболевания врач поставит вам диагноз. В этом случае, если вы страдаете от сыпи, лихорадки, головной боли и рвоты, то, скорее всего, вы страдаете малярией.

Врач может сделать вывод, основываясь на своем прошлом опыте, когда он видел, что многие пациенты с этими симптомами страдают от малярии.

Ограничения экспертных систем

  1. Экспертные системы не могут объяснить большое количество данных, которые нужно понять.
  2. Правила могут быть очень сложными - если существует слишком много правил, в которых нужно использовать слишком много перестановок и комбинаций.
  3. Иногда правила могут быть невыразимыми - задача найма кандидата на основе его честности и того, как он выступает на собеседовании.
  4. Иногда правила могут быть неизвестны - Задача прогнозирования нового заболевания.

Из-за этих ограничений было разработано машинное обучение.

Шесть банок машинного обучения

ДАННЫЕ - это топливо машинного обучения.

Данные повсюду. Чтобы выполнить контролируемое машинное обучение, вы должны найти связь между входной переменной X (обычно данные будут иметь большие размеры и закодированы как числа, поскольку мы можем выполнять функции только с числами) и выходной переменной y.

Данные также могут быть объяснены как исторические данные с пометкой. Данные могут быть таблицей из базы данных, изображением, видео и аудиофайлом (данные речи).

Откуда мне взять эти данные?

Многие данные доступны в Интернете в виде открытого источника.

Некоторые из источников данных:

  1. Наборы данных правительства Индии

2. Наборы данных Google AI

3. Репозиторий UCI

Процесс создания данных или получения данных называется курированием данных.

В основном данные делятся на 2 типа

  1. Структурированные данные.
  2. Неструктурированные данные: изображение ниже содержит текстовые данные, данные изображения. Входными данными здесь являются неструктурированные данные.

ЗАДАЧИ, которые вы можете выполнить с данными.

Задача - это четкое определение того, что такое входы и выход.

Примеры:

  1. Определение действий по изображению.
  2. Определение местоположения изображения.
  3. Выявление объектов на изображении.

В контролируемом обучении у нас есть 2 задачи.

  1. Классификационная задача.
  2. Задача регрессии.

В обучении без учителя у нас есть 2 задачи.

  1. Задача кластеризации.
  2. Задача генерации: генерирует новые входные данные из уже имеющихся входных данных.

МОДЕЛИ определяют истинную неизвестную связь между входами и выходами.

Эти отношения можно назвать функцией, выразить которую может быть очень сложно.

Соотношение между входами и выходом может быть любым.

  1. Линейное отношение.
  2. Полиномиальное отношение любой степени.

На изображении выше у нас есть первое уравнение, линейная связь, а остальные - полиномиальные уравнения степени «n».

ПОТЕРЯ ФУНКЦИЯ

Вышеприведенное уравнение представляет собой сумму всех элементов квадратов значений разницы между фактическими и прогнозируемыми значениями.

АЛГОРИТМ ОБУЧЕНИЯ

Нахождение наилучшего уравнения для проблемы путем пробования случайных значений коэффициентов с минимальными потерями - это процесс обучения - подход Bruteforce.

На практике грубая сила невозможна, потому что у нас будет n коэффициентов или параметров, которые необходимо оценить.

Эффективный способ вычисления параметров?

Доступно множество решений по оптимизации.

  1. Градиентный спуск
  2. Адаград
  3. RMSProp
  4. Адам

ОЦЕНКА

Оценка модели будет вычисляться с использованием таких показателей оценки, как точность, RMS, AUC, MAE, MSE.

С помощью этих шести банок мы сможем легче понять процесс машинного обучения.

Этот блог написан с помощью курса от ONE FOURTH LABS.