Прохождение воронки собеседования по науке о данных и шаги, чтобы получить ваше первое предложение

Несмотря на то, что существует множество блогов, видеороликов и учебных пособий о том, как стать специалистом по данным, многие из этих ресурсов страдают от того, что я люблю называть «проклятием знаний». Что это такое? Что ж, большинство из них созданы людьми, которые уже некоторое время занимаются анализом данных и поэтому забыли о узких местах и ​​проблемах, связанных с получением вашей первой работы в качестве специалиста по данным.

Помню, когда я начал подавать заявки на позиции data science в Лондоне (на тот момент у меня был чуть более двух лет опыта работы аналитиком данных), почти на всех этапах было много отказов. Я, наверное, сделал сотни заявок, чтобы только пара перешла на следующий этап. Даже по тем заявкам, которые прошли процесс отбора, было много отказов, прежде чем мне удалось получить свое первое предложение. На самом деле, были времена, когда я решил вообще отказаться от процесса (иногда даже на месяцы), будучи убежденным, что моя мечта стать специалистом по данным неосуществима. Иногда мне хочется вернуться в прошлое и помочь себе разобраться со сложностями и неизвестными воронки интервью по науке о данных и сэкономить часть потерянного времени.

Имея это в виду, я хотел построить эту статью немного по-другому. Вместо того, чтобы сосредотачиваться на технических требованиях, таких как статистика, программирование и машинное обучение (не волнуйтесь, мы не будем их полностью пропускать), я хотел создать руководство, в котором основное внимание будет уделено этапам процесса собеседования и тому, на чем следует сосредоточиться. чтобы получить первое предложение. В частности, статья будет построена следующим образом:

  1. Составление схемы воронки собеседования по науке о данных
  2. Откройте ворота своим резюме
  3. Техническая оценка (на вынос)
  4. Прямые интервью с нанимающими специалистов по данным
  5. Учитесь на своих ошибках

1. Отображение воронки собеседования по науке о данных

Процесс собеседования для большинства вакансий в области науки о данных обычно включает от трех до пяти этапов. Хотя они будут немного отличаться в зависимости от типа специалиста по данным, которым вы хотите быть, и компании, в которую вы подаете заявку, строительные блоки будут одинаковыми.

Первые два этапа являются частью процесса скрининга. Это ваше резюме (CV) и первоначальный звонок рекрутеру. На данный момент вы все еще стучитесь в парадную дверь компании. Идея состоит в том, чтобы сузить круг кандидатов до небольшой группы лиц, которые будут приглашены «внутри дома».

Оказавшись внутри дома, вам все равно нужно доказать, что вы достаточно квалифицированы для этой должности. Другими словами, вам нужно продемонстрировать, что у вас есть правильное отношение и набор навыков, чтобы они хотели нанять вас, но также могли это оправдать. Это приводит к трем этапам ниже (обратите внимание, что не все этапы будут присутствовать в каждом процессе собеседования):

  • Техническая оценка (на вынос). Этот этап предназначен для проверки вашего логического мышления и уровня компетенции в статистике и программировании (SQL, R или Python). По сути, они хотят оценить, достаточно ли ваших знаний основ, чтобы двигаться дальше в дом.
  • Интервью в прямом эфире с (наймом) учеными данных: этот этап включает видеозвонок (после того, как Covid ударил по Covid), во время которого старшие или ведущие специалисты по данным попросят вас решить проблемы и ответить на вопросы, основанные на повседневных дневные задачи, которые вы должны будете выполнить, если их наймут. В этот момент вы хорошо внутри дома.
  • Заключительное собеседование. Этот этап присутствует не всегда, но в устоявшихся командах по анализу данных в качестве последнего барьера у вас будет короткий звонок со старшим руководителем группы по анализу данных (руководителем или директором). Идея состоит в том, чтобы они узнали вас и дали «зеленый свет» или подняли любые красные флаги.

Итак, теперь, когда мы лучше понимаем этапы, давайте углубимся в каждый из них, чтобы вы могли лучше понять, как они структурированы и как подойти к ним, чтобы получить свою первую роль в науке о данных.

2. Откройте ворота своим резюме

При создании своего резюме тщательно подумайте о том, каким специалистом по данным вы хотите быть. Если вы хотите выковать правильный ключ, вы должны сначала подумать о типе двери, которую вы хотите, чтобы он открывал. Существует два основных типа (входных) должностей специалистов по данным (т. е. дверей):

  • Ученый по аналитике данных: основные обязанности — тестирование AB, специальная аналитика для улучшения кампаний, предложений или продуктов, а также создание простых (в основном исследовательских) моделей машинного обучения, таких как кластеризация.
  • Основной специалист по данным. Основные обязанности – построение прогностических моделей (с максимальной точностью), которые можно внедрить в производственную среду.

Если вы хотите узнать больше о различных типах ролей специалиста по данным и их соответствующих повседневных задачах, вы также можете посмотреть видео ниже.

В то время как типичный ключ будет иметь форму небольшого куска металла определенной формы с насечками, вырезанными так, чтобы они подходили под защиту конкретного замка, в вашем резюме будут указаны ключевые слова и опыт работы. .

К сожалению, даже если вы подделаете правильный ключ, вероятность успеха на этом этапе будет самой низкой за весь процесс собеседования. В первую очередь это связано с присущей этому этапу хаотичностью и поспешностью (вы, наверное, слышали, что большинство резюме просматриваются 2–3 секунды, прежде чем будет принято решение).

С другой стороны, подача заявки без получения ответов может обескуражить вас, ведь у вас есть все необходимое для создания правильного ключа. В большинстве описаний вакансий эти ключевые слова уже указаны, поэтому вам остается: а) определить, какие роли вам подходят, б) подобрать общие ключевые слова и требуемые навыки и в) убедиться, что они четко указаны в вашем резюме. . Доверьтесь этому простому процессу, и при нужном объеме заявок вы перейдете на следующий этап (простой случай сходимости по закону больших чисел).

Как упоминалось ранее, второй частью процесса отбора является телефонный звонок рекрутеру. Обычно это длится 15–20 минут, и (нетехнический) рекрутер начинает с того, что дает вам некоторую информацию о компании и роли. После этого рекрутер спросит вас о вашем опыте работы, периоде уведомления, визовых требованиях, ожиданиях по вознаграждению и некоторых вопросах, касающихся должности. Общие вопросы, к которым нужно подготовиться:

  • Не могли бы вы быстро рассказать мне о своем резюме/опыте работы?
  • Чем вас интересует эта должность в нашей компании?
  • Что вы ищете в новой роли или по-другому сформулированы, какие задачи или обязанности вы ищете?
  • Какие инструменты и приемы вы использовали на своих нынешних или предыдущих должностях?

Несмотря на то, что они могут показаться простыми, я рекомендую попрактиковаться в них пару раз. Как гласит цитата Авраама Линкольна, «дайте мне шесть часов, чтобы срубить дерево, и первые четыре я потрачу на то, чтобы точить топор».

3. Техническая оценка (на вынос)

Техническое домашнее задание обычно представляет собой серию вопросов. Обычно они включают следующее:

  • Напишите функцию для решения простой задачи (например, вычисления первых 10 чисел Фибоначчи, превышающих 1000), используя R или Python.
  • При наличии одной или нескольких таблиц (обычно не более двух) вам будет предложено написать код на SQL для извлечения или обработки данных. Эти вопросы обычно начинаются с простого, например, с подсчета общего количества строк, соответствующих определенным критериям, а последние вопросы требуют использования различных типов соединений и оконных функций.
  • Учитывая диаграмму или небольшую таблицу, вам будет предложено использовать статистику, чтобы сделать правильные выводы. Наиболее частые вопросы касаются асимметричных распределений, средних значений и центральной предельной теоремы.
  • Учитывая определенную бизнес-проблему, вас попросят написать краткое предложение по ключевым показателям эффективности и анализу, которые вы выбрали бы для достижения желаемого результата.

Я не могу не подчеркнуть важность двойной (или тройной) проверки ваших ответов и проверки вашего кода. Я также рекомендую добавлять эти проверки, когда это возможно, в ваши решения или код. Дополнительную информацию об операторах SQL и тестировании кода можно найти в статье ниже.



В качестве альтернативы вам может быть предложено задание с данными. В частности, вам будет предоставлен набор данных и обзор задания или проблемы. Например, в моем домашнем задании для Deliveroo задача заключалась в том, чтобы проанализировать эффективность их программы Rider Gets Rider по сравнению с другими маркетинговыми каналами. Последним этапом задачи было представление резюме информации старшим нетехническим заинтересованным сторонам и предложение возможных следующих шагов. Если вам нужна дополнительная помощь на этом этапе, я рекомендую прочитать руководство ниже.



4. Живые интервью с нанимающими специалистов по данным

Это будет самая сложная часть собеседования. Это не только интервью в прямом эфире, но и самый высокий уровень сложности в воронке. Сказав это, вы можете рассчитывать на справедливую оценку, поскольку интервьюер будет полностью привлекать ваше внимание на протяжении всего видеозвонка.

До COVID-19 большинство технических интервью проводились на сайте компании (буквально внутри «дома»). Однако в настоящее время подавляющее большинство делается с помощью масштабирования или других инструментов видеоконференцсвязи. Эти интервью проводятся одним или двумя исследователями данных и обычно состоят из следующих трех частей:

4.1 Оценка поведения/отношения

В этой части вопросы в основном не технические и направлены на оценку ваших мягких навыков и характера. Общие вопросы:

  • Можете ли вы описать ситуацию, когда вы столкнулись с проблемой, и объяснить шаги, которые вы предприняли для ее решения?
  • Расскажите мне о проекте, которым вы гордитесь, и о его влиянии на бизнес.

При подготовке ответов (следуя совету нашего друга Эйба Линкольна) важно всегда помнить, что на такие вопросы не существует правильного ответа. Вместо этого они ищут способность понимать, что в любой среде у вас будут препятствия, и что действительно важно, так это способность демонстрировать настойчивость и навыки, чтобы приносить пользу. Метод STAR является хорошей основой для обсуждения конкретной ситуации, задачи, действия и результата.

4.2 Оценка опыта

В этой части интервьюер поставит перед вами конкретную проблему, обычно основанную на задачах, которые вы должны будете выполнить, если вас примут на работу. Типичные сценарии следующие:

  • Мы недавно запустили кампанию или предложение и хотим оценить его эффективность. Опишите, как вы будете решать проблему от начала до конца (взаимодействие с заинтересованными сторонами бизнеса, понимание целей, получение необходимых данных, анализ и представление результатов).
  • Опишите, как бы вы разработали тест AB для конкретной функции или инициативы.
  • Если тест AB показывает, что желаемая метрика снижается, а другая метрика растет, как вы примете решение о том, следует ли нам запустить или отказаться от этой функции?

Не бойтесь задавать интервьюеру уточняющие вопросы и проведите их через ход ваших мыслей. Интервьюер будет оценивать вас как по вашей способности лучше понимать расплывчатые описания (поскольку они чаще всего появляются в реальной среде), так и по вашему подходу к решению этой проблемы. Кроме того, не стесняйтесь попросить интервьюера несколько минут, чтобы структурировать проблему, прежде чем ответить. Наконец, помните, что они ищут в новом сотруднике способность приносить пользу бизнесу, поэтому всегда структурируйте свои ответы с учетом этой полярной звезды.

4.3 Оценка технических навыков

В этой части вас будут оценивать по вашим техническим навыкам в области статистики, AB-тестирования и машинного обучения. Примеры вопросов:

  • Как бы вы описали p-значение и доверительные интервалы пятилетнему ребенку?
  • Можете ли вы объяснить, что такое загрузка и как она используется?
  • Как бы вы оценили размер выборки для теста AB перед его запуском?
  • Как бы вы проанализировали результаты теста AB в отношении выбросов и дисбаланса до теста?

Если вам нужно освежить знания или ознакомиться с приведенными выше вопросами, вы можете найти полное руководство по тестированию AB в бизнес-среде по ссылке ниже.



Я также настоятельно рекомендую бесплатную книгу Введение в статистическое обучение: с приложениями в R для изучения ключевых тем статистического обучения. В книге также рассматриваются такие вопросы, как:

  • Можете ли вы объяснить компромисс между смещением и дисперсией в машинном обучении?
  • Можете ли вы описать, что такое переобучение и как с ним бороться при построении прогностических моделей?
  • Можете ли вы описать разницу между моделированием с учителем и без учителя?
  • Можете ли вы описать, что такое перекрестная проверка и как она используется при оценке модели?

5. Учитесь на своих ошибках

Одна из наиболее часто упускаемых из виду частей процесса собеседования — запрос обратной связи. Это понятно, так как в большинстве случаев вы не получите ответа или это будет автоматический (бесполезный) ответ.

Мой совет — воспринимайте обратную связь как фокус-группу. Вам нужно десять или около того хороших ответов, чтобы точно определить общие области, которые вам нужно улучшить, но, что не менее важно, что сработало хорошо, а что следует оставить без изменений.

Еще один момент, который я хочу подчеркнуть, — это важность вашей собственной оценки компании на основе качества их процесса собеседования. Были ли приложены достаточные усилия на различных этапах, или это выглядело как поспешные усилия? Оценивали ли они вас по тому, чего вы ожидаете? Потратили ли они время и усилия, чтобы дать вам обратную связь? Даже если сегодня вас не возьмут на эту должность, вы всегда можете отметить компанию звездочкой для будущих заявлений, указав место, которого следует избегать, или место, которое следует искать.

Наконец, не думайте об отказе как о неудаче. Чем больше собеседований вы пройдете, тем лучше вы поймете, что требуется для должности, к которой вы стремитесь, и, что не менее важно, тем лучше вы будете к ней готовы! Как и во всем остальном, единственный способ стать лучше — это практиковаться. Как и в первый раз, когда вы ехали на велосипеде, вы не были заинтересованы в том, чтобы сделать это с первой попытки, и вы не были настолько смущены неудачей, что никогда не пробовали это снова.

Краткое содержание

🚀🚀 И с этим последним шагом мы достигли конца руководства. Ниже вы также можете найти краткое описание шагов:

✅ Убедитесь, что у вас есть четкое представление о задачах и обязанностях, которые вы хотите получить на своей первой должности, и используйте ключевые слова из соответствующих описаний должностей, чтобы создать правильный ключ (резюме).

✅ Всегда структурируйте свои ответы так, чтобы главная цель была полезной для бизнеса. Помните, что компания ищет не специалистов по статистике или программированию как таковых, а людей, которые могут извлечь пользу из больших данных.

✅ Практика может показаться скучной или излишней, но она будет иметь решающее значение в битве за ваше первое предложение по науке о данных.

✅ По возможности запрашивайте обратную связь, чтобы определить, что работает, а что нужно улучшить.

Оставайтесь на связи!

Если вам понравилось читать эту статью и вы хотите узнать больше, не забудьте подписаться, чтобы получать мои истории прямо на ваш почтовый ящик.

По ссылке ниже вы также можете найти бесплатное пошаговое руководство в формате PDF по выполнению кластерного анализа клиентов в реальном бизнес-сценарии с использованием методов обработки данных и лучших практик в R.