Специалисты по данным осознают, что успешный проект требует видимого влияния на бизнес-уровень в реальном времени с надлежащим планом, поэтому роль управления проектом становится жизненно важной. Любая отрасль, которая использует надлежащую систему управления проектами, обеспечивает блестящие результаты, и нет никаких исключений, когда речь идет о нашем любимом мире Data Science.

Однако, учитывая уникальный характер проектов по науке о данных, не всегда легко разобраться во всем в самом начале проекта. На карту поставлены взаимозависимости и результаты, которые могут выглядеть как подзадачи, что в большинстве случаев заканчивается неожиданностью. Таким образом, возникает очевидный вопрос: что можно сделать, чтобы наш проект был успешным и имел влияние на бизнес?

Ну, вот краткий список привычек или поведения, которые нам нужно развивать, чтобы сделать наш проект успешным.

  1. Общение — ключ к успеху. Поговорите с командой об усилиях, которые вы приложили к проекту, и будьте откровенны в отношении зависимостей и блокировщиков. Никогда не забывайте быть честным, когда вам нужна помощь других.
  2. Совместная работа нескольких команд – неотъемлемая часть любого проекта по обработке и анализу данных. Работая с инженерами, вы узнаете, что такое многопоточность, а они узнают, что такое модель XGBT, и изучение другого языка может значительно повысить вашу эффективность и может помочь в работе.
  3. Документация — это ключ к эффективному решению проблем и обслуживанию. Он защищает ваши усилия в проекте и может пригодиться другим командам, чтобы направить ваш документ для разработки, реализации, развертывания и обслуживания.
  4. Обмен знаниями играет ключевую роль в росте команды. Каждый раз, когда вы узнаете что-то новое, никогда не скрывайте это. Всегда делитесь с другими, чтобы команда тоже могла учиться и расти вместе.

Каждый проект — это командная работа, поэтому держите всех на одной волне, чтобы двигаться вперед как команда.

Какие ключевые вопросы следует задать заинтересованным сторонам бизнеса для успешного проекта по науке о данных?

Работа Data Scientist заключается в том, чтобы преобразовать потребности бизнеса в требования к технической модели. Но как сделать этот перевод и что нам нужно от заинтересованных сторон, чтобы формализовать наше требование к решению? Ну, вот что мы можем спросить:

1. Какова бизнес-цель проекта?

Получите общее представление о том, какова цель проекта, как выглядит результат, кто является конечными пользователями и какие показатели будут использоваться для измерения успеха. Это помогает формировать и направляет все остальное к лучшим решениям.

2. Можно ли решить или улучшить эту проблему с помощью науки о данных?

Многие аспекты бизнес-операций могут выполняться или улучшаться без участия команды Data Science. Ради эффективности всегда следите за тем, чтобы наука о данных не использовалась в каждом проекте без веской на то причины.

Основываясь на цели проекта, Data Scientist должен работать с заинтересованными сторонами, чтобы ответить на этот вопрос.

3. Как выглядит минимально жизнеспособный продукт (MVP)?

MVP — это версия продукта или решения с достаточным количеством функций для достижения цели проекта высокого уровня. Как следует из названия, это не окончательное решение, а образец конечного решения с возможностью масштабирования и улучшений.

MVP дает всем участвующим командам отправную точку для проекта, и масштабирование оттуда становится гораздо более управляемой задачей для заинтересованных сторон без каких-либо значительных затрат времени и денег.

4. Есть ли какие-либо соображения относительно этики или соблюдения требований?

Несмотря на то, что по всем направлениям существуют соображения этики или соответствия, это также очень актуально для индустрии данных. Мы, специалисты по данным, всегда должны знать о разрешениях на доступ к источникам данных, а также должны учитывать предвзятость, поскольку эффективность модели машинного обучения ненадежна из-за скрытой предвзятости данных.

Это то, чего мы, конечно, хотим избежать, поэтому очень важно задать этот вопрос бизнесу как можно раньше.

5. Как изменится продукт или решение с течением времени?

Будет ли созданное решение работать так же хорошо через шесть месяцев или год, как сейчас, или нет? Как мы собираемся это измерить? Важным фактором, который следует учитывать, является установка порогового значения, при котором мы будем считать, что наша модель машинного обучения, которая отслеживается в рабочей среде с помощью информационной панели, не соответствует общей бизнес-цели.

Кроме того, важным моментом обсуждения с заинтересованными сторонами будет вопрос о том, произойдет ли какое-либо отклонение данных в ближайшем будущем или какие-либо изменения в регулировании, о которых нам может потребоваться обновление.

Наконец, что не менее важно, обсудите с бизнесом частоту переобучения модели и автоматизацию конвейеров, поскольку это значительно повышает эффективность.

Надеюсь, вам понравилась эта статья. Дайте мне знать о ваших мыслях и предложениях по улучшению в разделе комментариев. Ждем следующей темы в ближайшее время.