Оценка модели в машинном обучении

Что такое оценка модели?

Оценка модели — это процесс анализа производительности модели машинного обучения с использованием различных критериев оценки, а оценка модели имеет решающее значение для определения эффективности модели на ранних этапах исследования, а также для мониторинга модели.[1]

Сегодня я упомяну два популярных подхода к оценке моделей:

Тестирование на выносливость
Перекрестная проверка

1. Тестирование удержания

Предположим, у меня есть набор данных, и я хочу использовать подходы машинного обучения. Если вы используете весь свой набор данных, для тестирования вашей модели не останется данных, следовательно, это не очень хорошая идея, но в предыдущих статьях я упоминал, что чем больше данных, тем лучше результаты обучения, так что мы должны делать? Мы должны разделить наш набор данных на обучение и тестирование и использовать большую часть данных для обучения. Например, это может быть 80% для обучения и 20% для тестирования (оценки). Так что я в основном ДЕРЖУ данные для тестирования :) Это была общая идея, лежащая в основе тестирования на выдержке, давайте обсудим ее немного подробнее.

Этапы проверки на выносливость

Разделите набор данных на две части (процентное разделение может варьироваться)

2. Обучите модель на обучающем наборе данных

3. Протестируйте модель на тестовом наборе данных.

4. Чтобы получить модель, которая может лучше обобщать неизвестный набор данных, обучите окончательную модель на полном наборе данных.

Примечание. На этом шаге я сделал предположение о фиксированном гиперпараметре. Гиперпараметры — это параметры, которые НЕ извлекаются из данных. Например; скорость обучения, лямбда-выражения в регуляризации…

Перекрестная проверка

Перекрестная проверка — это метод тестирования моделей машинного обучения на подмножествах доступных входных данных, а затем их оценка на другом подмножестве данных. Перекрестная проверка K-Fold многократно разделяет данные на обучающую и оценочную части.

Разделите набор данных на K дизъюнктных наборов одинакового размера.
Обучите модель для каждого эксперимента, оцените модель и рассчитайте предполагаемый риск (убыток) для каждого эксперимента.
Рассчитайте среднюю оценку риска.

Каково оптимальное значение К?

Обычно на практике выбирают K = 5 или K = 10, но мы также можем найти оптимальное значение K с настройкой гиперпараметров, о которой я расскажу далее.

Я считаю, что перекрестная проверка лучше, чем контрольное тестирование. Потому что наши обучающие данные итеративно меняются, и мы вычисляем лучшую модель в соответствии с различными комбинациями частей. В конце все данные обучаются, и в соответствии с этим рассчитывается оценка риска.

Пока мы не знаем, мы дали фиксированное число параметров, но, конечно, мы можем найти оптимальные гиперпараметры для каждой модели путем настройки гиперпараметров.

Настройка гиперпараметров

Поиск по сетке

→ 1. Выберите набор значений для каждого гиперпараметра в векторе гиперпараметров.

→ 2. Все комбинации значений-кандидатов для отдельных гиперпараметров являются кандидатами.

→ 3. Количество кандидатов является произведением количества значений отдельных гиперпараметров, поэтому количество гиперпараметров часто является экспоненциальным.

2.Случайный поиск

→ 1. Для каждого гиперпараметра в векторе гиперпараметров выберите диапазон значений.
→ 2. Кандидаты создаются случайным образом путем равномерного выбора каждого отдельного гиперпараметра из его диапазона

Результаты обычно немного лучше, чем поиск по сетке.

Выше приведена иллюстрация поиска по сетке и случайного поиска для нахождения наилучшей скорости обучения.

Итак, у нас есть обучающий набор и тестовый набор, но в каком наборе данных я должен найти оптимальные гиперпараметры?

Я могу создать набор проверки. Валидация означает «процесс принятия чего-либо официально или юридически приемлемым или утвержденным». [3]

Я могу разделить все свои наборы данных на три части: обучение, проверку и тестирование.

Из-за метода удержания:

Обучите модели-кандидаты (для различных гиперпараметров) на тренировочном наборе
Выберите лучшую комбинацию гиперпараметров в наборе проверки
Обучите модель с лучшими гиперпараметрами на наборе обучения + наборе проверки
Оцените эту модель, чтобы получить оценку ошибки
Обучите окончательную модель на всех данных
Разверните эту окончательную модель вместе с оценкой ошибки

Тот же принцип можно применить к перекрестной проверке: используйте одно подмножество для тестирования, одно для проверки, а остальные — для обучения в каждой итерации перекрестной проверки.

Использованная литература:

Machine Learning Hyperparameter Tuning

смотрите также:

Новые материалы

Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…

Просто начните и учитесь самостоятельно Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..

Лицензии с открытым исходным кодом: руководство для разработчиков и создателей

В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning