4 причины подождать, пока ваша команда станет более зрелой

Многие организации начинают свой путь в науке о данных, уделяя слишком много внимания исследованиям искусственного интеллекта и набрасываясь на докторов наук в безумии найма. Это хорошая идея, если:

  • Вы инвестируете в исследовательское подразделение и не планируете спрашивать своих исследователей, что они сделали для вас в последнее время.
  • Вы уже знаете, что решаете ценную, важную и проблему, которую, как известно, невозможно решить с помощью всех существующих алгоритмов.

Исследования ради исследований — это очень рискованная инвестиция, и очень немногие компании могут себе это позволить, потому что получить от этого ничего ценного — вполне реальная возможность.

Если вашей целью является решение бизнес-задач, вот несколько причин, по которым исследователь ИИ не должен быть вашим первым сотрудником:

  1. Они новички в вашей науке о данных.
  2. Они не имеют опыта работы с реальными данными.
  3. У вас нет подходящей среды для них.
  4. Вы не нашли для них хороший проект.

Прочтите этот абзац, если вы исследователь: Исследователи, я провел большую часть своей жизни в качестве одного из вас, поэтому я с огромным уважением отношусь к тому, насколько ценными вы можете быть, когда вы направлен на работу, которая уважает ваши навыки. Цель этой статьи не в том, чтобы отвратить от вас работодателей, а в том, чтобы избежать неприятной для всех участников ситуации: вас нанимают в среду, которая не готова оценить лучшее из того, что вы можете предложить. Настаивайте на том, чтобы работодатели выполняли их домашнюю работу, чтобы вы могли преуспеть в своей роли.

№ 1. Исследователи — новички в науке о данных вашего типа.

Есть 2 разных вида науки о данных; наймите тот, который вам действительно нужен.

  • Исследования (например, исследования в области искусственного интеллекта, статистические исследования, исследования в области обработки и анализа данных и т. д.)
  • Прикладной (например, разработка искусственного интеллекта, прикладная статистика, прикладная наука о данных и т. д.)

Если использовать аналогию с кухней, исследования ИИ связаны с инновациями в устройствах — созданием чертежей универсальных инструментов для использования другими. Это совсем другая дисциплина, чем прикладной ИИ, который больше связан с инновациями в рецептах в масштабе. Прикладной ИИ — это то, что вам нужно, если вы используете данные для решения бизнес-задач (в отличие от продажи способа решения своих бизнес-задач с помощью данных).

И то, и другое чрезвычайно ценно и важно, но опыт в одном редко приводит к другому. Конечно, исследования — это отличное место, где можно найти умного и трудолюбивого человека, но имейте в виду, что он будет изучать большинство необходимых навыков для прикладной науки о данных на работе. Подробнее здесь.

# 2 — Они не имеют опыта работы с реальными данными

Исследователи ИИ изобретают универсальные алгоритмы и подходы для использования другими. Они здесь не для того, чтобы решить вашу конкретную проблему, используя ваши конкретные данные. На самом деле, хотя данные из реального мира могут дать прекрасную возможность продемонстрировать свои изобретения в действии, не требуется много времени, чтобы данные стали слишком реальными для вкусов исследователей.

Никому не нужно дополнительное давление, связанное с одновременной борьбой с колебаниями скорости, возникающими из-за решения ииз-за особенностей данных. Безопаснее работать с хорошо известным и понятным набором данных, который не полон неожиданностей. Вот почему исследователи ИИ предпочитают работать с синтетическими наборами данных и эталическими наборами данных.

Синтетические наборы данных моделируются (генерируются компьютером из рецепта) для создания контролируемых условий. Исследователи ИИ используют их по тем же причинам, по которым их коллеги в лабораторных халатах предпочитают не проводить эксперименты на грязных тротуарах. Как и сам реальный мир, данные реального мира могут быть очень запутанными, отвлекая от исследовательского вопроса.

Исследователи предпочитают избегать реальных данных по тем же причинам, по которым их коллеги в лабораторных халатах предпочитают не проводить свои эксперименты на грязных тротуарах.

Поведение и сложности синтетического набора данных — знакомый друг, поэтому отладка становится менее кошмарной. Даже если исследовательская группа перейдет к оперативным данным бизнес-задачи, они сделают это только тогда, когда будут уверены, что их набор данных работает так, как ожидалось, на синтетическом наборе данных, что не так уж далеко от модульного тестирования в разработке программного обеспечения.

Наборы контрольных данных могут быть смоделированы или представлены в реальном мире наборами данных из прошлых проектов, которые исследовательское сообщество использует для сравнения результатов разных исследовательских групп. Если ваш алгоритм набирает 65 % на одном реальном наборе данных, а мой набирает 98 % на другом наборе данных, мой алгоритм лучше вашего? Невозможно сказать без сравнения яблок с яблоками с использованием эталонных данных.

Использование тестовых наборов данных похоже на то, что все соглашаются испытать свой прототип микроволновой печи на том же стакане очищенной воды, чтобы увидеть, кто быстрее закипит. Гросс, никто не планирует подавать эту воду клиентам.

Это не значит, что всем исследователям ИИ не нравятся наборы данных из реального мира — тематические исследования и доказательства концепций потрясающие, но вы разрабатываете методы, которые работают в целом, стерилизованная среда дает вам меньше причин, с последствиями которых вам нужно бороться.

Наличие стерилизованной исследовательской среды дает вам меньше причин, с последствиями которых вам нужно бороться.

Но я отвлекся. Я хочу сказать, что у исследователей вряд ли есть большой опыт работы с большим разнообразием реальных унаследованных наборов данных, бородавок и всего прочего, собранных без их участия. Это именно те данные, которые вы собираетесь им навязать. Подробнее о наследуемых данных здесь.

# 3 — У вас нет подходящей среды для них

Скорее всего, если вы подумываете о том, чтобы сделать исследователя своим первым сотрудником, у вас еще нет подходящей среды, чтобы использовать его с пользой. Единственное, что объединяет программы PhD, это то, что они вынуждают студентов специализироваться.

Специалисты прекрасны, и без них мы все были бы в темных веках, но они не обучены быть тем, что вам больше всего нужно в науке о данных: безжалостным прагматиком-универсалом.

Идеальным первым сотрудником в области науки о данных должен быть специалист широкого профиля, чья страсть состоит в том, чтобы делать все возможное, чтобы сделать данные полезными. Не существует слишком бессмысленного или дешевого подхода, если он выполняет свою работу.

Есть много случайных работ, которые нужно выполнить, прежде чем ваша команда будет готова к продуктивной работе. Все, от настройки инфраструктуры до приобретения активов данных, от споров с заинтересованными сторонами до роста вашей команды. Ваш идеальный сотрудник — это тот, кто готов засучить рукава и сделать все, что нужно.

Справедливости ради, многим оставшимся в живых докторам наук не терпится бросить свои выпускные платья в костер и радикально изменить карьеру, поэтому сама по себе степень не является противопоказанием для науки о данных. Отнюдь не. Но желание заниматься исследованиями противоречит требованиям быть первым сотрудником в прикладной сфере.

#4 — Вы не нашли для них хороший проект

Не приглашайте исследователей сразу же. Лучше подождать, пока ваша команда достаточно разовьется, чтобы понять, для чего им нужен исследователь.

Исследователи специализируются на изобретении новых способов решения проблем, а не новых решений проблем.

Поскольку исследователи специализируются на изобретении новых способов решения проблем, а не новых решений проблем (различие тонкое, но важное!) вам нужна их помощь только после того, как вы убедитесь, что алгоритмы, необходимые для решения вашей проблемы, еще не существуют. . Вот когда вы обращаетесь к исследователям за помощью в их изобретении.

Подождите, пока вы не исчерпаете все доступные инструменты, прежде чем нанимать кого-то, кто создаст вам новые дорогие инструменты.

Большинство команд не знают заранее, существуют ли уже инструменты для решения их проблемы, поэтому имеет смысл делать все в правильном порядке: прежде чем построить себе эту космическую ручку, сначала проверьте, справится ли с этой задачей карандаш. . Начните сначала, и если вы обнаружите, что доступные готовые решения не вызывают у вас особого интереса, тогда вам следует подумать о найме исследователей.

Краткое содержание

Исследователи не входят в исследовательское подразделение только в том случае, если у вас есть подходящие проблемы, которые им нужно решить — их набор навыков заключается в создании новых алгоритмов и тестов с нуля, когда готовой версии не существует — в противном случае они столкнутся с мрачной сизифовой спиралью. (что будет полностью вашей ошибкой, а не их). Исследователи обычно тратят более десяти лет на обучение, что заслуживает по крайней мере уважения за то, что их не заставляют работать над совершенно не относящимися к делу задачами.

Исследователи обычно тратят более десяти лет на обучение, что заслуживает по крайней мере уважения за то, что их не заставляют работать над совершенно не относящимися к делу задачами.

Подходящее время для найма исследователей для прикладного проекта, как правило, наступает после того, как ваши аналитики помогли вам определить ценный проект, а попытки завершить его с помощью специалистов по прикладным данным уже потерпели неудачу. Это когда вы привлекаете профессиональных изобретателей.

Итак, какой порядок найма лучше?

См. мой Руководство по 10 лучшим должностям в науке о данных и искусственном интеллекте, организованное по порядку приема на работу.