Полное руководство для инженера машинного обучения
Я получил множество запросов относительно рекомендуемого карьерного пути, чтобы стать инженером машинного обучения или специалистом по данным.
В этой части я стремлюсь дать общее руководство для всех, кто стремится стать инженером машинного обучения.
Отказ от ответственности: важно отметить, что путь к успеху в этой области (или, если на то пошло, в любой другой) может сильно различаться в зависимости от различных факторов, таких как предыдущее образование, математические способности и технологическое мастерство. Без личного понимания человека я могу дать только общий обзор.
Тем не менее, следующие пункты считаются важными для успешной карьеры инженера машинного обучения. Итак, приступим.
- Основы математики и статистики
Несмотря на то, что говорят нам социальные сети, прочная основа в области математики является фундаментальным требованием для инженера машинного обучения, для тех, кто занимается наукой о данных, это требование несколько смягчено, но в случае машинного обучения оно является обязательным и не подлежит обсуждению.
- Изучите программирование
Ознакомьтесь с Python и его библиотеками, такими как NumPy, Pandas и Matplotlib. Вы можете выбрать R, это нормально. У обоих есть свои плюсы и минусы.
- Изучите алгоритмы машинного обучения
Начните с контролируемых и неконтролируемых алгоритмов машинного обучения, таких как линейная и логистическая регрессия, деревья решений, случайные леса, k ближайших соседей и алгоритмы кластеризации.
- Получите практический опыт
Участвуйте в онлайн-соревнованиях по машинному обучению на таких платформах, как Kaggle, чтобы получить практический опыт создания и развертывания моделей машинного обучения.
- Алгоритмы глубокого обучения
Выполнив описанные выше шаги, перейдите к алгоритмам глубокого обучения, таким как Keras и TensorFlow.
#уведомление о мнении⚠️
Технология глубокого обучения слишком разрекламирована. Да, это причудливая часть, которая привлекает все внимание, но именно грязная работа, которую мы выполняем во время контролируемого и неконтролируемого обучения, готовит нас к пониманию этой работы. Я бы посоветовал НЕ сразу переходить к глубокому обучению!
- Большие данные и распределенные вычисления
Узнайте, как работать с технологиями больших данных, такими как Apache Spark и Hadoop, и как масштабировать модели машинного обучения с помощью распределенных вычислений.
- Развертывание
Наконец, узнайте, как развертывать модели машинного обучения в производственной среде и интегрировать их с другими системами.
Самое главное, поскольку это новая область, и многие ее возможности еще предстоит раскрыть, будьте в курсе, держите себя в курсе последних событий в области поле, следя за блогами машинного обучения и посещая конференции.
Надеюсь, это было полезно. Если вы сочтете это полезным, рассмотрите возможность оказания услуги, поделившись ею с другими, которым эта информация также может быть полезна. Спасибо!