За последние три года наблюдался «огромный рост — в 15, 20 раз — число рабочих мест, связанных с наукой о данных, в таких секторах, как образование, маркетинг и производство. — В этой статье Уортон подчеркивает массовый рост возможностей в области бизнес-аналитики. Но сколько денег бизнес смог заработать в результате этого бума? 40% организаций, делающих значительные инвестиции в ИИ, не сообщают о прибылях от ИИ для бизнеса, — говорится в отчете за октябрь 2019 года MIT Sloan и Boston Consulting Group.

Наличие нужных людей на этих должностях может обеспечить или помешать успеху этих инициатив в области обработки данных.

Компании должны найти таланты, которые демонстрируют эти три сильных столпа в качестве краеугольного камня, чтобы стать хорошим менеджером по продукту (аналитика) или специалистом по данным.

  1. Знание и владение необходимыми инструментами и языками
  2. Продемонстрированная способность использовать общую структуру для решения проблем с помощью аналитики
  3. Опыт того, как соединить точки со всеми заинтересованными сторонами вашей команды

"Лучшее вложение — это инструменты собственного производства". — Бенджамин Франклин

Мое любопытство узнать, как упростить информацию, чтобы улучшить качество обслуживания пациентов и изменить традиционное здравоохранение, возникло из-за того, что я участвовал в самых разных проектах общественного здравоохранения в Deloitte. В качестве следующего шага в своей карьере я хотел изучить возможности анализа данных.

Комплексная и интегрированная учебная программа программы «Магистр наук в области бизнес-аналитики» помогла мне развить навыки аналитики, данных и ведения бизнеса. Такие курсы, как «Статистическое исследование» и «Расширенная статистика», помогли мне расширить свои знания от исследовательской обработки данных до разработки экспериментов по проверке гипотез. Я также научился создавать сложные модели данных, такие как классификация и регрессия, кластеризация и другие алгоритмы, на курсах по машинному обучению и анализу больших данных с использованием таких языков программирования, как R, Python и SQL. Мои проекты помогли мне превратить эти концепции в практический опыт.

Конкурс Humana Mays Healthcare Analytics предоставил возможность поработать над многогранной и динамичной проблемой реального бизнеса. Цель состояла в том, чтобы разработать модель, которая могла бы предсказать, какие получатели Medicare с наибольшей вероятностью столкнутся с транспортными проблемами (социальная детерминанта здравоохранения). Мы использовали различные алгоритмы машинного обучения, такие как логистическая регрессия, случайный лес и нейронные сети, чтобы сосредоточиться на разработке признаков и определении наиболее подходящей модели. Мой проект по парсингу Amazon Deals научил меня различать структурированные и неструктурированные данные, а также то, как деконструкция неструктурированных данных может помочь в сборе ценной информации. Используя свои знания, полученные в ходе этих проектов, я готов браться за более сложные бизнес-задачи.

"Новые фреймворки похожи на восхождение на гору: более широкое представление охватывает, а не отвергает более ограниченное представление". — Альберт Эйнштейн

Я работал в Kiva, международной некоммерческой организации, в рамках моей 10-месячной практики в Калифорнийском университете в Дэвисе. Это технический проект, основанный на данных, направленный на определение способов минимизации текучести клиентов и расширения линейки продуктов Ежемесячный товар. Ключевым выводом из этого проекта стало то, как использование структуры анализа данных позволяет команде быстро и эффективно выполнять анализ. Мы использовали Team Data Science Process (TDSP), который представляет собой комбинацию Scrum и CRISP-DM Methodology для нашего практического занятия. Этот подход позволил нам расставить приоритеты в первую очередь для бизнес-результатов, а затем — для действий и решений, обеспечивающих эти результаты. Каждый этап требовал прямой связи с ценностью, которую он принесет нашему партнеру по практике.

Вот некоторые основные моменты этой структуры из нашего практического занятия:

Бизнес-понимание

Мы предприняли следующие шаги, чтобы оценить, что успех означает для нашего отраслевого партнера MSBA (MIP):

  1. Обсуждение в фокус-группе с заинтересованными сторонами проекта
  2. Вторичное исследование индустрии некоммерческого микрокредитования, конкурентов с аналогичными предложениями продуктов и личностей потребителей, использующих платформу.
  3. Определенные цели проекта через метрики успеха SMART

Сбор и анализ данных

Следующим этапом было понимание различных источников данных. Это включало:

  1. Идентификация персонажей нашего продукта, а также объединение и интеграция источников данных для извлечения информации об истории кредитования пользователей.
  2. Сохранение извлеченных признаков в словаре данных и привязка их к целям проекта
  3. Использование Looker для визуализации данных, расшифровки шаблонов в данных и Python для очистки и обработки данных.

Моделирование

Этот этап включал в себя разработку функций и выбор модели:

  1. Для разработки функций мы использовали опыт предметной области и идеи с информационных панелей Looker.
  2. Для прогнозирования оттока мы обучили и протестировали несколько моделей классификации, таких как логистическая регрессия и случайный лес.
  3. Мы сравнили показатели производительности каждой модели и результаты для определения адекватной модели, готовой к производству.

Развертывание

Развертывание модели машинного обучения имеет решающее значение, поскольку оно позволяет нам тестировать модель на данных в реальном времени:

  1. A/B-тесты были разработаны путем случайного предоставления небольшой группе подписчиков Monthly Good нового набора функций (обработка), а другой группе (контроль) — текущего набора функций.
  2. Результаты A/B-тестов помогут команде разработчиков продукта определить дополнительную ценность предлагаемых улучшений продукта.

Принятие клиентом

Этот заключительный этап состоит из двух основных процессов:

  1. Обеспечение того, чтобы наша модель соответствовала бизнес-требованиям и помогала в решении поставленной задачи.
  2. Выполнение плана передачи путем получения одобрения MIP на документации и проведения личных встреч с группой MIP по обработке и анализу данных, отвечающей за отслеживание действующих моделей в будущем.

Этот практический курс был возможностью «три в одном»: поработать над реальной бизнес-задачей, поработать с «большими данными» в чистом виде и оценить модель машинного обучения в режиме реального времени.

«Вы не можете соединить точки, глядя вперед; вы можете соединить их, только глядя назад». — Стив Джобс.

В моем предыдущем опыте работы я проводил клиентов через управление изменениями, собирая бизнес-требования, проектируя, внедряя и предоставляя технологические решения. Как консультант в Deloitte, я отвечал за выявление пробелов, которые необходимо было заполнить, чтобы клиенты могли достичь своих бизнес-целей. Это включало в себя выслушивание лидеров бизнеса о том, как они представляют свое будущее с точки зрения продуктов, программного обеспечения и услуг, а также о том, какая доля каждого из них должна обеспечивать наивысший уровень удовлетворенности клиентов. Это потребовало большого количества жонглирования с точки зрения того, что было технологически осуществимо, но при этом оставалось функционально надежным. Моя работа требовала, чтобы я несколько раз выступал в качестве бизнес-посредника между заказчиком, инфраструктурой, командами роста и обеспечения качества.

Работа над различными технологическими преобразованиями, которые включали улучшение бизнес-процессов, миграцию с устаревших платформ для использования новых технических возможностей и модернизацию производственных систем, расширила мой опыт работы в этих предприятиях. Эти роли научили меня надевать шляпу критического мышления для успешного решения проблем, проявлять любопытство к тому, как стратегические приоритеты клиента соотносятся с краткосрочными и долгосрочными целями, а также эффективно общаться и сотрудничать между заинтересованными сторонами проекта.

У каждой организации своя стратегия, своя линейка продуктов и разный набор клиентов. Но структура решения проблем для науки о данных остается общей для всех организаций. Я считаю, что мой опыт использования этого фреймворка может помочь мне адаптироваться к любой проблеме, связанной с наукой о данных. Мой предыдущий опыт и мои знания во время практики укрепили три столпа, необходимых для специалиста по науке о данных.