Уважаемые специалисты по данным!

Я инженер, ставший специалистом по данным. Я чувствую, что те, кто идет по тому же пути, могут найти отклик в этой статье. Если вы инженер или были инженером, эта статья для вас!

В течение долгого времени у нас была привычка и мышление, что реализация является сложной частью. Поэтому нашей целью была реализация. Но это меняется, как только мы входим в область науки. Наука о данных называется наукой, потому что это не только практическое применение теории, но и по большей части теория. Позвольте мне объяснить подробно.

В науке о данных мы пытаемся моделировать абстрактные конструкции, например. удовлетворенность клиентов. Эти конструкции являются теоретическими, мы пытаемся аппроксимировать их с помощью данных, например. опрос с оценками по шкале Лайкерта. Теперь, вдобавок к этому, мы либо пытаемся объяснить теоретическую конструкцию, используя наши приближения, либо пытаемся предсказать, используя это приближение, какую-то другую конструкцию, например. удержание клиентов путем его приближения, например. коэффициент удержания клиентов.

Поскольку мы имеем дело с теорией, крайне важно, чтобы научное мышление занимало первое место. При разработке анализа или реализации огромную роль играет теоретическое понимание проблемы (подробнее об этом читайте в моей статье здесь). Машинное обучение и программирование имеют решающее значение часть процесса науки о данных, но они часто упускают из виду усилия и усердие, необходимые для структурирования проблемы, над которой они могут работать. Они также не очень хорошо справляются с проблемами, связанными с их интерпретацией. Таким образом, нельзя недооценивать важность создания хорошей теоретической основы любой работы по науке о данных. Возможно, это самая сложная область!

Учитывая вышеизложенную информацию. У меня есть одно предложение, которое может сильно помочь вам в вашей работе. Как и ученые, работающие над своими экспериментами, приобретайте навыки ведения заметок. Ведите подробные записи о том, какие теоретические и практические шаги вы предпринимаете, и ведите дневник о том, почему вы делаете эти шаги. Запишите все наблюдения из вашей модели (вы можете использовать ведение журнала Python для создания журналов, которые могут быть просмотрены другими специалистами по данным).

В науке о данных проблемы связаны не только с логикой кодирования. Стохастические миры здесь могут не вернуть вас к ответам, игровое поле больше не детерминировано!

С уважением,

Я был бы рад обсудить эту и другие темы. Дайте мне знать ваши взгляды. Вы можете связаться со мной в LinkedIn.