Аминь! Это самая большая проблема, с которой я сталкиваюсь как нынешний Data Scientist, пытаясь снизить ожидания тех, кто выходит на поле. На самом деле выполнение бита ML обычно является самой маленькой частью проекта.
Это не для всех, но я думаю, что люди должны попробовать и увлечься процессом в целом. Это то, что движет мной. Я хочу поставлять системы или решения, которые полностью решают реальную бизнес-проблему. От получения данных, работы с ними и преобразования их в действенные идеи с использованием модели. Затем это необходимо развернуть так, чтобы это было удобно и понятно. Построение модели, обучение и оценка — это только один из шагов.
Это всего лишь предположение, но я думаю, что одержимость созданием новых блестящих моделей, которые превосходят конкурентов, обусловлена нашей культурой, основанной на результатах. В большинстве моделей у вас может быть метрика для определения ее успеха, а затем вы сводите свою работу к максимизации этой метрики, чтобы дать себе чувство выполненного долга в своей роли. Проблема в том, что вы отделяете свое видение от всего процесса вокруг модели. Неважно, насколько хороша модель, если предварительная обработка и развертывание скреплены липкой лентой, тогда все рухнет.
Действительно хорошая статья, большое спасибо!