Сертификации AWS являются одними из самых сложных и ценных в сфере технологий. Хотя каждый из них довольно крепкий, у ML Specialty есть особый соус. Он проверяет не только знания AWS, но и концептуальные знания машинного обучения, статистики и вероятностей.

О тесте

Экзамен состоит из 65 вопросов, 180 минут на выполнение и минимальной оценки 750/1000 для прохождения. Основной сервис AWS на экзамене — Sagemaker. Sagemaker — это не просто сервис машинного обучения, а полноценная платформа для машинного обучения. В нем есть инструменты для подготовки данных, обучения моделей, обслуживания моделей, исследовательского анализа, autoML и так далее. Хотя Sagemaker сдает большую часть экзамена, есть также вопросы по IAM, S3, Redshift, некоторым базовым сетевым технологиям, шифрованию и другим сервисам, управляемым AWS AI.

Здесь я делюсь некоторыми советами, которые пригодились мне при подготовке к тесту. Давайте перейдем к этому.

Совет №1 — Запланируйте экзамен

Это самый важный совет, который у меня есть для вас, ребята. Это не кажется большой рекомендацией, но я обещаю вам, что существует огромная разница, когда вы учитесь С запланированным экзаменом и БЕЗ запланированного экзамена. Когда у вас запланированный экзамен, ваш мозг понимает, что вам нужно подготовиться, и тогда вы начинаете уделять приоритетное внимание сертификационному обучению. По моему опыту, качество обучения также значительно улучшается. Когда у вас нет дедлайна, вы учитесь только в том случае, если у вас есть свободное время. Итак, очень важно поставить цель.

Совет № 2. Знайте свою статистику и показатели машинного обучения

Как я уже говорил ранее, этот экзамен проверит, обладаете ли вы реальными знаниями в области теории машинного обучения. Поэтому обязательно знать некоторые распространенные распределения вероятностей, такие как нормальное (гауссово), Бернулли, Пуассона, и когда лучше всего использовать каждое из них в зависимости от конкретного случая. Кроме того, вы должны быть знакомы с наиболее распространенными метриками оценки ML, как для задач регрессии, так и для классификации. Например, вы должны знать, как объяснить (и рассчитать) MSE, RMSE, MAE для регрессии, отзыв, точность и оценку F1 для классификации. На экзамене у меня был вопрос: мне дали матрицу путаницы и попросили рассчитать точность моделей.

Кроме того, если вы знакомы с повседневным обучением моделей и прогнозированием, вам придется ответить на несколько сложных вопросов. Например, один вопрос касался того, как следует обращаться с масштабатором данных для предварительной обработки данных. Среди вариантов у меня было (а) обучить скалер с данными поезда и тестовыми данными отдельно, (б) обучить скалер с данными поезда и тестовыми данными вместе, (в) обучить скалер с данными поезда и использовать тот же скалер для данные испытаний…

Если вы готовы к тесту, знайте, что правильный ответ — (с).

Совет № 3. Знайте управляемые сервисы искусственного интеллекта и Sagemaker.

Большая часть экзамена будет проверять ваши знания об управляемых AWS сервисах искусственного интеллекта, включая Transcribe, Translate, Textract, Rekognition, Polly, Comprehend, Kendra, Lex, Personalize… Вы должны быть хорошо знакомы с тем, что делает каждый из этих сервисов, что это лучший сценарий для каждого из них и того, как они соединяются. Обычно более эффективно использовать управляемый ИИ, когда это возможно, чем разрабатывать собственную модель.

На самом деле, в моем обзоре рынка я вижу множество компаний, разрабатывающих индивидуальные модели, когда они связаны с основным бизнесом организации и, следовательно, очень критичны и зависят от контекста. Если это не основной бизнес, компании, как правило, используют управляемый ИИ (много!).

Sagemaker — центральная часть разработки ИИ в AWS. В нем есть инструменты для обработки данных, обучения моделей, развертывания, пакетного прогнозирования, прогнозирования в реальном времени, AutoML, построения рабочих процессов и т. д. Кроме того, опыт специалистов по обработке данных превратился из работы с простым блокнотом/лабораторией Jupyter на одном сервере EC2 в использование очень полной и оптимизированной интегрированной среды разработки, которая интегрирует большинство частей Sagemaker для моделирования машинного обучения.

Это единственный парень, которого вам следует знать поглубже к экзамену.

Совет №4 — Сеть, IAM и безопасность

Это экзамен по специальности. Таким образом, ожидается, что вы имеете определенное представление об общих принципах AWS. На экзамене будут показаны некоторые основы работы в сети (VPC, частные и общедоступные подсети, шлюзы NAT, таблицы маршрутов и т. д.), управление доступом с помощью IAM и безопасность данных (особенно возможности шифрования), и вы должны об этом знать.

Кроме того, большая часть данных, с которыми работает Sagemaker, поступает из S3. Вы должны хорошо это знать, его многоуровневость, различия в выставлении счетов и решениях для шифрования.

Совет №5 — Знайте, что вы способны на это

Хотя экзамен довольно сложен, приложив усилия и сосредоточенность, его можно пройти. Если вы работаете с AWS всего 3 месяца, я бы не рекомендовал сдавать этот экзамен, а начинал с более базовых, таких как Cloud Practitioner или Solutions Architect Associate. Дайте время, наберитесь терпения, будьте постоянны и сосредоточены на учебе и знайте, что результат такого экзамена строится «по кирпичику». Результаты моих первых тестовых экзаменов были катастрофическими. Однако постепенно, с упорством я наращивал свои результаты, пока не сдал экзамен.

Есть фраза, которую я говорю уже более 10 лет, преподавая на курсах бакалавриата и магистратуры, и которая (опять же) также сослужила мне службу в этом процессе:

Нет ничего настолько сложного, чему бы я не смог научиться, потратив достаточно времени и усилий.

Найдите метод обучения, который подойдет именно вам, посмотрите занятия (мои любимые — курсы Стефана Марика на Udemy), сдайте много тестовых экзаменов, чтобы усилить свои слабости, и, прежде всего, получайте удовольствие. Сертификация – это не крутой значок или красивая бумажка с вашим именем. Речь идет о знаниях, которые вы приобретаете в процессе!