Эта статья призвана объяснить первокурсникам важность знания предметной области. Приведенный ниже пример взят из моего собственного опыта.

Бизнес по своей природе хочет получать прибыль, а зачем это нужно для получения прибыли? С точки зрения сотрудника, компания дает зарплату и рост; с точки зрения компании, она намерена оставаться долгой, живой и свежей по мере своего роста.

Прибыль = Доход — Стоимость

Если бизнес должен оставаться дольше, прибыль должна быть положительной. Это означает, что либо выручка должна увеличиться, либо затраты должны уменьшиться; также, оба могут случиться.

Давайте рассмотрим простые сценарии бизнес-кейсов, которые помогут нам понять, почему понимание бизнеса важнее всего, прежде чем мы найдем решение.

Пример { Розничный магазин

Предположим, что специалисту по данным была поставлена ​​задача помочь розничному магазину запастись нужным количеством. Интуитивно большинство специалистов по данным рассматривают данные за последние X лет для прогнозирования. Они могут брать различные модели от простых средних до ARIMA и LSTM и выбирать лучшую модель на основе показателей оценки, таких как AIC, BIC или MAPE. { Классические алгоритмы моделирования временных рядов }

После этого упражнения мы определим количество, которое можно было бы продать за следующий период. Это заканчивается здесь?

Не будет, потому что мы не ответили на деловой вопрос о том, какими должны быть акции на следующий период. т. е. сколько товаров должно храниться в магазине?

Скажем, если мы хотим продолжить сам вывод модели. Так как модели присуща предвзятость и дисперсия, некоторые товары могут быть распроданы раньше, а другие не будут продаваться так, как предполагалось. { С другой стороны, иногда компания не могла закупить товары, как указано, из-за нехватки денежных средств. О чем мы поговорим в других случаях}

Что произойдет, если на складе нет товаров; выручка падает. В качестве альтернативы, что произойдет, если есть избыточный запас; стоимость увеличивается. В обоих случаях прибыль уменьшается.

Должны ли мы сделать вывод, что наука о данных не помогает в этом сценарии? Нет, это не так.

Просто она не была адекватно решена. Пока мы поставили шапку «Машинное обучение», которое нужно начинать с шапки «Традиционные исследования».

В рамках традиционных исследований мы можем узнать следующее:

  1. Запасы будут поступать со складов раз в два дня, для чего отступ необходимо разделить на день раньше.
  2. Во всех случаях в магазине должен храниться буферный или страховой запас для быстро оборачиваемых товаров, чтобы избежать потрясений в цепочке поставок.
  3. Чтобы избежать эффекта кнута, вероятные прогнозы по определенным товарам должны быть доведены до сведения поставщиков для эффективной координации.
  4. Моделирование должно быть построено таким образом, чтобы запасы в магазине не были слишком большими, чтобы избежать высоких коммерческих издержек. Кроме того, магазин должен поддерживать достаточный уровень обслуживания (товаров, т. е. наличия на складе), чтобы покупатель не столкнулся с негативным опытом.

На основе этих знаний мы изучим любые существующие методологии, доступные для решения этих вопросов.

Бинго!!

Мы бы взломали решение, просмотрев темы Аналитика цепочки поставок или Оптимизация операций.

Который предоставит методы для достижения страхового запаса, уровня повторного заказа, количества повторного заказа и уровней обслуживания.

Отсюда мы можем использовать ML (моделирование временных рядов), чтобы получить прогноз на завтра, и выполнить моделирование (Моделирование Монте-Карло), чтобы получить уровни обслуживания для различных кластеров (Кластеризация K-средних) продуктов. Эти выходные данные вводятся в вышеприведенное решение, которое мы видели в Традиционных исследованиях.

Позже мы надеваем шляпу «Разработка программного обеспечения», чтобы точно настроить код и держать сквозные части в режиме невмешательства.

Таким образом, специалисты по данным должны сменить шляпу, чтобы завершить работу.

В этом случае мы ясно видим, что шапка «Традиционные исследования» крайне необходима для понимания «картины земли». В противном случае все усилия по моделированию столкнулись бы с кризисом идентичности.

Существуют ли какие-либо определенные предписания или правила для понимания местности? Ответ НЕТ. Длинный ответ

  • Любопытство узнать о домене.
  • Задавайте бизнесу правильные вопросы.
  • Проведение личных исследований, поскольку иногда бизнес управляется восприятием или опытом. { Только «свежий взгляд» дает новую перспективу }
  • Изучение того, что уже сделали другие. Было бы уже доступно множество исследований. { В большинстве случаев нет необходимости в новом IP-адресе}
  • Изучение концепций консультантов, таких как матрица BCG, жизненный цикл продукта, жизненный цикл клиента и т. д., поможет нам думать об альтернативных перспективах.

Есть несколько примеров, с которыми я лично столкнулся в начале своей карьеры в науке о данных, которые убедительно показали мне важность знаний предметной области. Приведенный выше пример является одним из таких классических.

Следите за новостями в области науки о данных.