Как вы можете получить работу по науке о данных — ключевые моменты, о которых следует помнить.
Краткое представление обо мне
Привет, ребята, меня зовут Матвей, мне 25 лет. Я окончил Варшавскую школу экономики по специальности «Количественные методы в экономике и информационных системах». В настоящее время я почти закончила магистратуру в том же университете по специальности аналитика данных.
У меня 1,5 года опыта работы специалистом по данным (Python ❤), 8 месяцев опыта работы программистом-статистиком (SAS) и 4 месяца стажировки в EY в качестве консультанта в проекте, который проходил на Мальте.
Буду рад подключиться здесь.
Как устроиться на работу в Data Science?
Итак, в этой статье я хотел бы написать о том, как получить работу в области науки о данных (или связанной с ней) с точки зрения новичка. Лучший способ поделиться своим мнением — напечатать некоторые ключевые моменты.
Поехали.
1. Будьте НАСТОЯЩИМ любителем в своей области, например, энтузиастом обработки данных, энтузиастом Python, мастером визуализации данных, богом обработки естественного языка (NLP) и т. д.
В свободное время старайтесь программировать как можно больше. Недавно я создал очень простое и до сих пор не совсем работающее приложение, которое может обнаруживать рак кожи (еще нет, но оно в разработке: https://share.streamlit.io/mateuszdalba/skin_cancer_app/app.py).
Неважно, что это простое приложение не работаеткак должно (прогнозы все равно неверны; модель нужно переобучить), важно то, что я мог экспериментировать с такими библиотеками, как Streamlit, Keras , TensorFlow, OpenCV и т. д. Мои навыки точно выросли.
Завершив такой побочный проект, вы не только научитесь кодировать и использовать различные библиотеки, но также сможете узнать, например. Git и как развернуть собственное приложение в рабочей среде. Такой опыт обязательно окупится в будущем.
2. Подать заявку на стажировку (чем раньше, тем лучше)
Вероятно, это самый важный шаг, который вы можете сделать, чтобы повысить свою карьеру в качестве Data Scientist. Как можно быстрее подайте заявку на стажировку, связанную с данными, и попытайтесь работать с реальными данными. Я бы посоветовал подать заявку на стартап-компанию или малый бизнес, чтобы у вас было гораздо больше ответственности, а с большей ответственностью вы росли намного быстрее.
Часто бывает так, что в крупных компаниях в качестве стажера или джуниора меньше шансов, что вы будете вовлечены в каждый процесс проекта ML. В небольших компаниях вы будете участвовать в каждой части процесса, такой как встречи с клиентами, сбор данных, обработка данных, понимание данных (например, EDA), моделирование, развертывание модели в производстве, мониторинг модели и т. д.
3. Знать все элементы науки о данных, но специализироваться в одной (максимум двух) областях
Наука о данных — очень широкий термин. Он включает в себя визуализацию данных, обработку данных, анализ данных, машинное обучение, статистику, глубокое обучение и многое другое. Обычно профессионалы в этой области специализируются, например, либо на НЛП, либо на задачах обработки изображений.
Вам нужно понять, что делает вас счастливее — работа с изображениями или текстом. Я привел только два примера [НЛП/Обработка изображений], но есть из чего выбрать. Вы можете быть опытным инженером данных, вы можете быть очень хороши в создании графиков и рассказывании историй о данных — это ваш выбор, каким специалистом по данным вы хотите быть.
Просто постарайтесь сосредоточиться на одной области.
Ведро на выбор:
Визуализация данных, прогнозирование временных рядов, контролируемое машинное обучение, неконтролируемое машинное обучение, обучение с подкреплением, инженерия данных, обработка/анализ изображений, обработка естественного языка, эконометрика, статистика, кластеризация и т. д.
4. Изучите математику, стоящую за моделями, а не только то, как их кодировать
Не только научиться правильно программировать, но и узнать о моделях и математике, лежащей в основе моделей. Как работает конкретная модель? Математика важна, потому что иногда [в основном во время интервью] вам придется объяснять, например. рассказать клиенту, как работает эта модель линейной регрессии и какую ценность она принесет его бизнесу.
Заключение
Просто получайте удовольствие от работы с данными и программирования.
Это самый важный совет :)
Спасибо за ваше время!
Если вам понравилась статья, оставьте комментарий или лайк :)
Мои предыдущие статьи:
1. Краткое изложение основных методов науки о данных
2. Начинающий анализ данных с пандами
Свяжитесь со мной:
Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.