Как вы можете получить работу по науке о данных — ключевые моменты, о которых следует помнить.

Краткое представление обо мне

Привет, ребята, меня зовут Матвей, мне 25 лет. Я окончил Варшавскую школу экономики по специальности «Количественные методы в экономике и информационных системах». В настоящее время я почти закончила магистратуру в том же университете по специальности аналитика данных.

У меня 1,5 года опыта работы специалистом по данным (Python ❤), 8 месяцев опыта работы программистом-статистиком (SAS) и 4 месяца стажировки в EY в качестве консультанта в проекте, который проходил на Мальте.

Буду рад подключиться здесь.

Как устроиться на работу в Data Science?

Итак, в этой статье я хотел бы написать о том, как получить работу в области науки о данных (или связанной с ней) с точки зрения новичка. Лучший способ поделиться своим мнением — напечатать некоторые ключевые моменты.

Поехали.

1. Будьте НАСТОЯЩИМ любителем в своей области, например, энтузиастом обработки данных, энтузиастом Python, мастером визуализации данных, богом обработки естественного языка (NLP) и т. д.

В свободное время старайтесь программировать как можно больше. Недавно я создал очень простое и до сих пор не совсем работающее приложение, которое может обнаруживать рак кожи (еще нет, но оно в разработке: https://share.streamlit.io/mateuszdalba/skin_cancer_app/app.py).

Неважно, что это простое приложение не работаеткак должно (прогнозы все равно неверны; модель нужно переобучить), важно то, что я мог экспериментировать с такими библиотеками, как Streamlit, Keras , TensorFlow, OpenCV и т. д. Мои навыки точно выросли.

Завершив такой побочный проект, вы не только научитесь кодировать и использовать различные библиотеки, но также сможете узнать, например. Git и как развернуть собственное приложение в рабочей среде. Такой опыт обязательно окупится в будущем.

2. Подать заявку на стажировку (чем раньше, тем лучше)

Вероятно, это самый важный шаг, который вы можете сделать, чтобы повысить свою карьеру в качестве Data Scientist. Как можно быстрее подайте заявку на стажировку, связанную с данными, и попытайтесь работать с реальными данными. Я бы посоветовал подать заявку на стартап-компанию или малый бизнес, чтобы у вас было гораздо больше ответственности, а с большей ответственностью вы росли намного быстрее.

Часто бывает так, что в крупных компаниях в качестве стажера или джуниора меньше шансов, что вы будете вовлечены в каждый процесс проекта ML. В небольших компаниях вы будете участвовать в каждой части процесса, такой как встречи с клиентами, сбор данных, обработка данных, понимание данных (например, EDA), моделирование, развертывание модели в производстве, мониторинг модели и т. д.

3. Знать все элементы науки о данных, но специализироваться в одной (максимум двух) областях

Наука о данных — очень широкий термин. Он включает в себя визуализацию данных, обработку данных, анализ данных, машинное обучение, статистику, глубокое обучение и многое другое. Обычно профессионалы в этой области специализируются, например, либо на НЛП, либо на задачах обработки изображений.

Вам нужно понять, что делает вас счастливее — работа с изображениями или текстом. Я привел только два примера [НЛП/Обработка изображений], но есть из чего выбрать. Вы можете быть опытным инженером данных, вы можете быть очень хороши в создании графиков и рассказывании историй о данных — это ваш выбор, каким специалистом по данным вы хотите быть.

Просто постарайтесь сосредоточиться на одной области.

Ведро на выбор:

Визуализация данных, прогнозирование временных рядов, контролируемое машинное обучение, неконтролируемое машинное обучение, обучение с подкреплением, инженерия данных, обработка/анализ изображений, обработка естественного языка, эконометрика, статистика, кластеризация и т. д.

4. Изучите математику, стоящую за моделями, а не только то, как их кодировать

Не только научиться правильно программировать, но и узнать о моделях и математике, лежащей в основе моделей. Как работает конкретная модель? Математика важна, потому что иногда [в основном во время интервью] вам придется объяснять, например. рассказать клиенту, как работает эта модель линейной регрессии и какую ценность она принесет его бизнесу.

Заключение

Просто получайте удовольствие от работы с данными и программирования.

Это самый важный совет :)

Спасибо за ваше время!

Если вам понравилась статья, оставьте комментарий или лайк :)

Мои предыдущие статьи:

1. Краткое изложение основных методов науки о данных



2. Начинающий анализ данных с пандами



Свяжитесь со мной:



Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.