Ник Гейлорд
Когда дело доходит до будущего ведения бизнеса, ИИ и машинное обучение являются самыми горячими темами. Тем не менее, несмотря на все обсуждения перспектив ИИ, чего-то все еще не хватает — прямой информации о том, как заставить ИИ работать на вас. Если вы подойдете к своему решению неправильно, ваши результаты не будут иметь смысла, но если вы сделаете это правильно, вы сможете построить эффективную систему, которая продвинет ваш бизнес вперед. Мы помогли многим организациям успешно внедрить решения на основе ИИ — вот несколько практических советов о том, как решить эту проблему.
Мы говорим об автоматизации бизнес-процессов
Решения ИИ часто включают повторяющиеся, трудоемкие задачи и разработку методов для их более эффективного выполнения. Это означает, что часто ИИ является формой автоматизации бизнес-процессов (BPA), за исключением того, что процесс, который вы автоматизируете, основан на информированном человеческом суждении. BPA обычно решает предсказуемые, часто повторяющиеся задачи, но достижения в области вычислительной техники резко расширили область того, что можно автоматизировать, включая такие вещи, как автоматическая обработка текстов и изображений. Тем не менее, такое размышление о решениях ИИ может помочь вам структурировать подход к внедрению на более знакомой основе.
Работа над автоматической обработкой текста началась полвека назад. Когда Почтовая служба США начала использовать оптическое распознавание символов (OCR) для сортировки почты, это был традиционный BPA насквозь — машины были запрограммированы на распознавание символов в частях напечатанных адресных этикеток, и в результате письма маршрутизировались. Однако на заре современного искусственного интеллекта дела пошли в гору. Теперь мы можем создавать системы, способные делать действительно впечатляющие вещи, такие как понимание значения и тональности текстов и распознавание объектов на изображениях.
Задолго до появления современного ИИ Почтовая служба США использовала форму обработки текста для автоматизации доставки почты. Источник изображения: это потрясающее видео 1970 года.
Помните, однако, что ваша система ИИ не делает ничего мистического. Все дело в том, чтобы научиться распознавать шаблоны в данных и использовать эти шаблоны для автоматической обработки других данных — намного быстрее и в гораздо большем масштабе. Ключевое различие между автоматизацией на основе ИИ и BPA в более широком смысле заключается в том, что ИИ обучается, а не создается.
Обучение требует времени. Будьте пошаговыми.
Вы, вероятно, не стали бы нанимать неопытного человека и ожидать, что он сразу сделает работу идеально. И вы, вероятно, не стали бы давать им сначала самое сложное задание, когда вы могли бы начать с чего-то более простого. Успешная адаптация требует соответствующей подготовки и разумных ожиданий. Машинное обучение тоже учится — ваш ИИ хорош настолько, насколько хороши данные, на которых он обучался, — так что эта мудрость по-прежнему актуальна.
Получение максимальной отдачи от ваших данных — это процесс постепенного улучшения. Источник изображения: toptal.com
Когда мы думаем об автоматизации, мы часто думаем о быстрых, сверхточных процессах, которые работают одним щелчком выключателя. Понятно, что люди относятся к ИИ с одинаковыми ожиданиями, особенно когда речь идет о знакомых задачах, таких как понимание текста и изображений. Помните, однако, что это сложные задачи, и с вашим решением на основе ИИ тоже нужно учиться. Для достижения наилучших результатов может потребоваться время, но это не значит, что вы не можете извлечь выгоду из своей системы прямо сейчас.
Вместо того, чтобы ожидать полной автоматизации с самого начала, рассмотрите возможность постепенного внедрения ИИ в свой процесс. Сосредоточив внимание на самых надежных прогнозах вашей системы ИИ, которые будут наиболее точными, вы сможете быстро и уверенно автоматизировать часть своей работы. Это также поможет вам оценить, какой объем работы вы можете автоматизировать, а что лучше оставить людям. Например, хотя почти вся почта в США теперь автоматически сортируется с помощью OCR, люди все еще готовы справиться с особенно грязным письмом и неполными адресами.
Корректировка структуры вашего процесса также может помочь вам извлечь выгоду из ИИ. Я работал со многими организациями, которые хотели очень детально классифицировать свои данные, но часто они получали больше от ИИ, сосредотачиваясь на более грубых вопросах, таких как разделение жалоб, требующих действия и бездействия, или определение того, содержат ли твиты ключевое слово. были связаны с их брендом. Когда Почтовая служба начала автоматически сортировать письма, они начали с почтовых индексов, а не целых адресов. Начните с простого. Частичная автоматизация все еще может привести к большим прибылям.
Есть компромиссы
Сборка компонента включает в себя одни и те же шаги, независимо от того, выполняется ли она человеком или машиной, и машина может сделать это быстрее. Однако использование ИИ для автоматизации таких задач, как классификация текста или анализ изображений, — это не совсем то же самое. У людей есть разум, тогда как машины просто ищут закономерности в функциях, которые они извлекают из данных.
Это означает, что машины могут вести себя иначе, чем их коллеги-люди, в том, как они классифицируют вещи. Часто это улучшает результаты, но иногда также может привести к ошибкам, которые человек не допустил бы. Не позволяйте этому подорвать вашу уверенность в ИИ — по крайней мере, не обязательно. Ваша система, вероятно, также сделала правильно некоторые вещи, которые люди упустили бы. Помните, что обучение — это постепенный процесс, и, сосредоточившись на высокоточных прогнозах вашей системы, вы, вероятно, все же сможете автоматизировать часть обработки данных с точностью человеческого уровня, а с правильными данными ваша модель со временем улучшится.
Внедрение ИИ также почти наверняка означает определенное изменение поведения. Роли могут меняться, процессы могут меняться, и ваши результаты могут выглядеть немного иначе. Организации часто не хотят менять поведение, потому что есть разрыв в преемственности и первоначальные затраты на адаптацию. Но преодолеть это препятствие стоит, потому что вы адаптируетесь быстрее, чем думаете, а положительные преимущества автоматизации вашего трудоемкого процесса с лихвой компенсируют затраты на переход. На самом деле, это, вероятно, даже откроет возможности, которых раньше не было.
Внедрение новой технологии сопряжено с некоторыми компромиссами, но преимущества, скорее всего, перевешивают затраты.
Укрепление доверия
При оценке работника-человека может иметь смысл выборочно проверить его работу — выбрать несколько недавних суждений, которые они сделали, и посмотреть, выглядят ли они обоснованными. Основываясь на этом, вы можете сделать довольно надежные выводы о том, насколько хорошей будет остальная их работа. Хотя это может быть полезной стратегией для оценки сотрудников-людей, есть причины использовать ее с осторожностью при оценке производительности вашей системы искусственного интеллекта.
Во-первых, поскольку ваш ИИ может работать в гораздо большем масштабе, чем человек, ваша небольшая горстка примеров менее репрезентативна. Во-вторых, поскольку машины и люди рассуждают по-разному, вы должны оценивать их по-разному. В-третьих, и это наиболее важно, слишком много выборочной проверки может привести к тому, что вы зациклитесь на определенных отдельных ошибках. Я видел организации, которые были новичками в ИИ, без необходимости теряли веру, потому что сталкивались с одной или двумя «необъяснимыми» ошибками, хотя их система в целом работала довольно хорошо.
Вместо этого рассмотрите возможность оценки вашего классификатора в более крупном масштабе. Одним из вариантов является метод, известный как перекрестная проверка; другой — создать отдельный большой тестовый набор элементов, которые вы держите для оценки прогнозов вашей модели. Являются ли прогнозы с высокой достоверностью точными? Улучшается ли производительность модели со временем, когда вы собираете больше обучающих данных? Он превосходит или борется с определенными типами примеров? Ответы на эти вопросы с использованием большего набора данных помогут вам оценить вашу систему искусственного интеллекта гораздо более полезным способом.
Важность функций для примера модели в CrowdFlower AI. Термины, выделенные зеленым цветом, предсказывают негативное отношение к впечатлениям авиакомпаний, а термины, выделенные серым цветом, предсказывают обратное. Наличие некоторых нечетных элементов отражает ограниченный объем обучающих данных в модели.
Заголовок: Важность характеристик для образца модели в CrowdFlower AI. Термины, выделенные зеленым цветом, предсказывают негативное отношение к впечатлениям авиакомпаний, а термины, выделенные серым цветом, предсказывают обратное. Наличие некоторых нечетных элементов отражает ограниченный объем обучающих данных в модели.
Кроме того, спросите, почему ваша система ИИ сделала именно такие прогнозы. Как мы упоминали ранее, ИИ работает, беря входные данные и извлекая из них характеристики (такие как последовательности слов в тексте или цветовые узоры на изображениях) и используя эти характеристики для идентификации новых предметов. Поняв, что заставляет вашу модель делать предсказания, модель становится менее черным ящиком, и вы даже можете определить возможности для улучшения. Если вы действительно хотите копнуть глубже, эта статья, вероятно, является лучшим обсуждением темы, которое я когда-либо читал.
Поддерживайте и улучшайте свои модели с течением времени
Точная классификация данных часто является движущейся целью. Ваши данные со временем меняются, как и вопросы, на которые вы пытаетесь ответить. Новость, которая год назад была актуальна для вашей компании, сегодня может уже не иметь значения, а то, что когда-то было малоприоритетным вопросом поддержки клиентов, теперь может стать критическим. Чтобы зафиксировать эти изменения и поддерживать точность вашей системы искусственного интеллекта, вам необходимо проводить постоянную оценку и техническое обслуживание.
Самая важная задача текущего обслуживания — поддерживать актуальность данных о тренировках. Вы захотите предоставить своему классификатору свежие данные, чтобы убедиться, что новые тенденции точно фиксируются и доступны для модели. Вы также захотите убедиться, что метки, применяемые к вашим данным, согласованы, и что, когда что-то меняется, устаревшие элементы в обучающих данных либо обновляются, либо удаляются, чтобы вы не путали свою модель.
Рабочий процесс CrowdFlower AI с участием человека поддерживает три наиболее важные концепции, обсуждаемые здесь: сосредоточьтесь на своих прогнозах с высокой степенью достоверности; сочетайте человеческий и машинный интеллект, чтобы получить наилучшие результаты, и итерируйте разработку своей модели ИИ.
Ключевым компонентом этого процесса является обучение человека в цикле, процесс обучения модели, когда модель запрашивает участие человека только в тех элементах, в которых она не уверена, — это означает, что участие человека становится максимально эффективным, а модель получает именно те данные, которые ему нужны. Обучение с участием человека в цикле стимулирует CrowdFlower AI, который мы создали специально для максимально эффективного начала работы с решениями искусственного интеллекта корпоративного уровня. Сочетая среду машинного обучения с первоклассной платформой для обогащения данных, CrowdFlower AI позволяет легко сочетать лучшие аспекты человеческого и машинного интеллекта в масштабе.
Ник — старший научный сотрудник CrowdFlower, где он работает в основном над созданием их нового предложения по машинному обучению — CrowdFlower AI. До CrowdFlower он был специалистом по данным в стартапе по текстовой аналитике научной фантастики Idibon. У него есть докторская степень Техасского университета в Остине, где его исследования были сосредоточены на понимании человеческого языка и построении наборов данных для приложений НЛП. В свободное время он чинит велосипеды и сотрудничает в работе по применению принципов когнитивной науки в сфере общественного здравоохранения. Вы можете следить за ним в Твиттере на @texastacos.