AutoML в настоящее время является одной из горячих тем решений на основе ИИ. Автоматизированное машинное обучение — это предлагаемое решение на основе ИИ для решения растущих проблем, связанных с использованием машинного обучения, которое автоматизирует реальные трудоемкие повторяющиеся задачи. Процесс потенциально включает в себя все этапы, начиная с необработанного набора данных и заканчивая созданием модели машинного обучения, готовой к развертыванию.
Это похоже на разработку приложения машинного обучения, не мешая работе большинства нейронов.
Как говорится на упаковках консервов: открывай, жарь и ешь.
Как работает AutoML?
Этот вопрос постоянно возникает у всех, поскольку это выглядит как ярлык для приложений машинного обучения.
В последние несколько лет область машинного обучения начала отходить от сложных моделей и вместо этого использовать более простые модели, которые легче интерпретировать. Почему? Поскольку трудно понять, когда модель вносит предвзятость, потому что сложные модели трудно расшифровать. AutoML пришел на помощь в этой проблеме сложной модели, скрывая не только математику модели, но и выполняя в фоновом режиме следующее:
- Очистка данных
- выбор функции
- выбор модели
- выбор параметра.
Обычные методы, используемые в AutoML, включают оптимизацию гиперпараметров, метаобучение и поиск нейронной архитектуры.
Автоматизированное машинное обучение создает несколько параллельных конвейеров для проверки различных параметров алгоритма в сочетании с выбором функций, где каждая итерация создает модель с оценкой обучения. Чем лучше оценка для нужной метрики, тем лучше модель считает, что она «соответствует» вашим данным. Этот процесс остановится, как только будет создана модель, соответствующая критериям выхода, определенным в эксперименте.
Следующая диаграмма иллюстрирует описанный выше процесс:
Что нового в этом автоматизированном подходе?
Типичное приложение машинного обучения использует набор точек входных данных для обучения. Но эксперт должен сделать данные пригодными для машинного обучения, применяя методы предварительной обработки данных, разработки признаков, извлечения признаков и выбора признаков. После этого мы должны выполнить выбор алгоритма и оптимизацию гиперпараметров, чтобы максимизировать прогностическую эффективность их модели.
Все эти сложные шаги создают препятствия в использовании машинного обучения даже для известных людей, которые упрощаются и обходят AutoML.
Такая высокая степень автоматизации в AutoML позволяет даже неспециалистам использовать модели и методы машинного обучения. Автоматизация процесса сквозного применения машинного обучения предлагает преимущества создания простых решений и моделей, которые часто превосходят модели, разработанные вручную, при этом полностью сохраняя качество моделей с большим масштабом, эффективностью и производительностью.
Инструменты автоматизированного машинного обучения Область применения: охватывает все аспекты рабочего процесса машинного обучения, которые потенциально могут быть автоматизированы.
Несколько примеров рабочего процесса машинного обучения, который можно автоматизировать
- Подготовка и прием данных
- Типы данных: логические, дискретные/непрерывные числа, текст
- Обнаружение задач: бинарная классификация, регрессия, кластеризация, ранжирование и др.
2. Разработка функций — это может занять много времени, но автоматизация некоторых из них может сэкономить время.
- Таким образом, задачи на этом этапе — это выбор функций, предварительная обработка, извлечение, обнаружение искаженных данных и обнаружение отсутствующих значений.
3. Выбор модели. Включает поиск общего типа модели для использования и поиск архитектуры, чтобы найти конкретную структуру, наиболее подходящую для данной задачи данных.
Наконец, есть автоматизация этапа оценки, всего, от процедур проверки до проверки на наличие ошибок, а также анализа и визуализации результатов. И, обходя все эти утомительные и сложные шаги, AutoML доказывает, что может стать благом для будущих ученых и разработчиков.
Станет ли AutoML проклятием для специалистов по данным?
Нет, не может, но оказался для них хорошим помощником. Специалист по данным понимает и проверяет данные, а не больше, чем AutoML, при выборе модели и настройке гиперпараметров.
Когда вы смотрели выступление Рэндалла Олсена (ученого по данным и исследователя искусственного интеллекта) на Scipy 2018 Прошлое, настоящее и будущее автоматизированного машинного обучения. Он отмечает, что AutoML не заменит Data Scientist, а поможет повысить продуктивность нынешних специалистов по данным и сделать область более доступной для тех, кто не изучал эти алгоритмы годами, но все еще хочет заниматься и хочет исследовать это поле.
Думаете, как это поможет?
Специалисты по машинному обучению, разработчики и специалисты по данным в различных отраслях могут использовать автоматизированное машинное обучение для:
- Внедряйте решения ML без обширных знаний в области программирования
- Экономьте время и ресурсы
- Используйте лучшие практики обработки данных
- Обеспечьте гибкое решение проблем
Следующая диаграмма поможет вам лучше понять.
Тем не менее, AutoML по-прежнему может служить напарником, который может перепроверить вашу работу и предоставить много тяжелой работы тем, кто пытается создать приложение ИИ.
Вы все еще думаете, что Недостатки существуют?
В настоящее время каждый может претендовать на звание профессионала в области машинного обучения. Поскольку все больше и больше людей предпочитают играть с машинным обучением, опасный аспект заключается в том, что они используют сверлильный станок, но не знают, как это сделать правильно.
Мы видели множество сообщений о неверных/предвзятых моделях прогнозирования, которые постоянно циркулируют в течение последних нескольких лет. Если в реальном мире есть погрешность, ее можно легко увеличить, если не учесть ее должным образом в модели. Вот почему, если мы используем AutoML для полной автоматизации процесса, это принесет больше вреда, чем пользы. Однако полная автоматизация является целью лишь горстки исследовательских компаний, что также может иметь катастрофические последствия. Это предубеждение может быть глубоко скрыто внутри части машинного обучения, что будет создавать проблемы в будущем.
Просто сядьте перед компьютером, сделайте несколько выборов на нескольких экранах, и Avada kedavra, вы устраните все сложные препятствия и создадите приложение для машинного обучения, которое делает все, о чем вы мечтали. Неужели жизнь настолько проста? Я так не думаю. Давайте не будем возлагать слишком большие надежды на то, что использование новейших и лучших достижений в области автоматизированного машинного обучения сделает вас экспертом в области машинного обучения.
«Люди могут приходить и уходить, а я буду жить вечно».
Ручей автора Альфред Лорд Теннисон
Время — лучший учитель, поэтому Время покажет.
Это означает, что если AutoML является «поверхностным» и просто предоставляет вспомогательное оборудование поверхностного уровня для создания приложений машинного обучения, это опасно, в то время как если AutoML полностью охватывает и реализует дополнительные возможности для обеспечения понимания принципов этики ИИ, мы надеемся, что он будет делать больше пользы, чем вреда.
На данный момент AutoML все еще находится в зачаточном состоянии, и многие скажут, что приложения для машинного обучения, созданные с помощью AutoML, представляют собой скорее прототипы и пилотные проекты, а не полноценные (конечно, это спорно).
Те, кто разбирается в машинном обучении, уже смотрят на AutoML с чувством беспокойства, что потенциальное отупение машинного обучения станет неблагоприятным скользким путем; тем временем они приветствуют хорошо продуманный AutoML, который может поддерживать профессиональную работу над машинным обучением.
Еще одна сторона, которая может принести большую пользу сообществу, — это AutoML, который отлично помогает специалистам по данным.
Это зависит от нас, людей, что мы собираемся делать.
Спасибо, что прочитали мою статью!
Подпишитесь бесплатно, чтобы получать новые посты и поддерживать мою работу.