Экспертная система - это часть программного обеспечения, которое использует базы данных экспертных знаний для предоставления рекомендаций или принятия решений в таких областях, как медицинская диагностика.
Пример. Предположим, вы страдаете какой-то болезнью и посетили врача. На основании симптомов вашего заболевания врач поставит вам диагноз. В этом случае, если вы страдаете от сыпи, лихорадки, головной боли и рвоты, то, скорее всего, вы страдаете малярией.
Врач может сделать вывод, основываясь на своем прошлом опыте, когда он видел, что многие пациенты с этими симптомами страдают от малярии.
Ограничения экспертных систем
- Экспертные системы не могут объяснить большое количество данных, которые нужно понять.
- Правила могут быть очень сложными - если существует слишком много правил, в которых нужно использовать слишком много перестановок и комбинаций.
- Иногда правила могут быть невыразимыми - задача найма кандидата на основе его честности и того, как он выступает на собеседовании.
- Иногда правила могут быть неизвестны - Задача прогнозирования нового заболевания.
Из-за этих ограничений было разработано машинное обучение.
Шесть банок машинного обучения
ДАННЫЕ - это топливо машинного обучения.
Данные повсюду. Чтобы выполнить контролируемое машинное обучение, вы должны найти связь между входной переменной X (обычно данные будут иметь большие размеры и закодированы как числа, поскольку мы можем выполнять функции только с числами) и выходной переменной y.
Данные также могут быть объяснены как исторические данные с пометкой. Данные могут быть таблицей из базы данных, изображением, видео и аудиофайлом (данные речи).
Откуда мне взять эти данные?
Многие данные доступны в Интернете в виде открытого источника.
Некоторые из источников данных:
Процесс создания данных или получения данных называется курированием данных.
В основном данные делятся на 2 типа
- Структурированные данные.
- Неструктурированные данные: изображение ниже содержит текстовые данные, данные изображения. Входными данными здесь являются неструктурированные данные.
ЗАДАЧИ, которые вы можете выполнить с данными.
Задача - это четкое определение того, что такое входы и выход.
Примеры:
- Определение действий по изображению.
- Определение местоположения изображения.
- Выявление объектов на изображении.
В контролируемом обучении у нас есть 2 задачи.
- Классификационная задача.
- Задача регрессии.
В обучении без учителя у нас есть 2 задачи.
- Задача кластеризации.
- Задача генерации: генерирует новые входные данные из уже имеющихся входных данных.
МОДЕЛИ определяют истинную неизвестную связь между входами и выходами.
Эти отношения можно назвать функцией, выразить которую может быть очень сложно.
Соотношение между входами и выходом может быть любым.
- Линейное отношение.
- Полиномиальное отношение любой степени.
На изображении выше у нас есть первое уравнение, линейная связь, а остальные - полиномиальные уравнения степени «n».
ПОТЕРЯ ФУНКЦИЯ
Вышеприведенное уравнение представляет собой сумму всех элементов квадратов значений разницы между фактическими и прогнозируемыми значениями.
АЛГОРИТМ ОБУЧЕНИЯ
Нахождение наилучшего уравнения для проблемы путем пробования случайных значений коэффициентов с минимальными потерями - это процесс обучения - подход Bruteforce.
На практике грубая сила невозможна, потому что у нас будет n коэффициентов или параметров, которые необходимо оценить.
Эффективный способ вычисления параметров?
Доступно множество решений по оптимизации.
- Градиентный спуск
- Адаград
- RMSProp
- Адам
ОЦЕНКА
Оценка модели будет вычисляться с использованием таких показателей оценки, как точность, RMS, AUC, MAE, MSE.
С помощью этих шести банок мы сможем легче понять процесс машинного обучения.
Этот блог написан с помощью курса от ONE FOURTH LABS.