Когда-то мир с искусственным интеллектом был научной фантастикой, но теперь это повседневная работа индустрии программного обеспечения. Технологии искусственного интеллекта меняют продукты: от самостоятельной парковки автомобилей до автоматизации бизнес-процессов и городского планирования до голосового перевода. и процессы в разных отраслях.

Цель этих технологий - уменьшить участие человека и повторяющиеся усилия в процессах, на которые они нацелены, но мы не перестанем писать электронные письма и складывать полотенца в ближайшее время. Мы живем в переходную эпоху, когда обязанности распределяются между людьми и компьютерами в зависимости от их компетенции и приоритета.

В переходный период возникла большая путаница в отношении того, являются ли люди или компьютеры основными действующими лицами таких продуктов, как Facebook M и Operator. Но, как я объясню, люди всегда будут частью системы. Таким образом, мы не должны сосредотачиваться на том, как заменить людей в системе, а скорее на том, как оптимально интегрировать вклад людей и компьютеров. Здесь я описываю, как это работает в настоящее время, и формулирую цели в области интеллектуальных технологий в будущем.

Видения будущего

В 2000 году у многих технологов было грандиозное видение того, во что превратится Интернет. Некоторые полагали, что Интернет станет великим каталогом человеческих знаний; он будет хорошо структурирован и стандартизирован, организован по сравнению с любой книгой, написанной ранее. Тим Бернерс Ли, провидец движения под названием Semantic Web, объяснил свое видение:

Интернет был разработан как информационное пространство… [пока] большая часть информации в Интернете предназначена для потребления человеком, и даже если она была получена из базы данных с четко определенным значением (по крайней мере, в некоторых терминах) для столбцов, структура данных не очевидна для робота, просматривающего Интернет.

Он считал, что контент можно было бы легко понять как для людей, так и для машин, если бы мы договорились о структурированном формате. Например, фраза «Пауль Шустер родился в Дрездене» будет иметь следующий формат:

Если бы мы могли соответствующим образом сопоставить наши человеческие знания, возможно, мы могли бы просто передать их машине, позволить ей сделать все остальное и получить прибыль.

Но реальность такова, что в Интернете огромный беспорядок. Понятно, что никто не решил тщательно обозначать свой текст в соответствии с предписаниями Семантической паутины, поэтому Интернет полон языков, которые легко понять только людям. Машины не могут взять на себя наши задачи, и мы по-прежнему звоним в службу поддержки, чтобы получить ответы от реальных людей.

Таким образом, эти реалии породили новую потребность - сопоставить, собрать и каталогизировать Интернет после появления его содержимого. Фактически, Интернет представляет собой такой неразрешимый беспорядок, что самая дорогая компания в мире создает продукт под названием «поиск», который позволяет пользователям копаться в куче мусора, чтобы найти то, что им нужно. Мы возвращаемся к исходной проблеме структурирования данных таким образом, чтобы в конечном итоге компьютеры могли их использовать.

Поиск, как и другие технологии ординации, использовал огромное количество программных подходов для решения этой сложной проблемы. И одна дисциплина стала нашим самым ценным союзником.

Искусственный интеллект

Искусственный интеллект включает в себя любую систему, имитирующую интеллект (какое бы определение ни было модным; когда-то выигрывал в шахматы, теперь планирует полеты). Некоторые технологии могут быть частью системы искусственного интеллекта:

  • Машинное обучение, использующее статистику для обоснованных предположений.
  • Обработка естественного языка, которая структурирует человеческий язык, чтобы компьютеры могли его обрабатывать.

В общих чертах, машинное обучение берет шаблоны из данных о прошлом и делает выводы о том, что может произойти в будущем. Например, предположим, что я создаю алгоритм машинного обучения, используя множество изображений кошек. Он может научиться распознавать изображение кошки.

Но как это называется изображением кофемашины для приготовления эспрессо? «не кошка». Он знаком исключительно с кошками, а не с кофемашинами эспрессо.

По подобным причинам (и изображения кошек без шерсти) алгоритмы машинного обучения обычно могут достигать только 70–80% точности и полноты при нормальных условиях и до 90% при определенных обстоятельствах.

Это означает, что если вы создадите сервис на основе одного из этих алгоритмов, он будет неточным или в среднем давать сбой в 1 из 4 раз. Представьте, что агент по обслуживанию клиентов один из четырех раз дает неверную информацию - для потребителя это недостаточно надежно.

Поскольку машинное обучение наталкивается на стену точности, оно наталкивается на стену полезности. Но там, где компьютеры будут поставлены в тупик, действительно сияют люди:

Важное понимание состоит в том, что компьютеры полезны для конкретных дискретных задач, но менее полезны для более широких индуктивных задач. Ни компьютер, ни человек объективно не лучше - просто у них разные сильные стороны.

Возможно, самая тонкая и важная человеческая характеристика - это способность узнавать новое. Компьютер не может интуитивно почувствовать, когда сталкивается с чем-то, чего никогда раньше не видел. У людей есть je ne sais quoi, творческая и адаптивная способность теоретизировать за пределами прошлого опыта.

В конечном итоге мы не увидим, что один превосходит другого. Зная это, мы должны использовать другой подход к построению предприятий и технологий с использованием искусственного интеллекта, потому что интеллект никогда не будет на 100% искусственным.

Парадигма гибридного интеллекта

В попытке использовать то, что лучше всего умеют люди и компьютеры, возникла новая парадигма. В гибридном интеллекте система просит людей вынести суждения, когда компьютер менее уверен, в результате чего получается наиболее точная и заслуживающая доверия система.

Где мы это видим?

Чаще всего гибридный интеллект используется в системах данных корпоративных компаний, прежде всего для своих собственных целей. Крупные технологические компании обычно используют комбинацию людей и компьютеров для создания, обогащения и проверки данных. Эти данные часто используются для дальнейшего обучения алгоритмов машинного обучения с целью постепенного повышения уровня автоматизации.

В последние несколько лет мы также начали видеть потребительские приложения, использующие гибридный интеллект. К любопытному воодушевлению потребителей, искусственные помощники (или личные агенты) выполняют простые задачи, аналогичные человеческим помощникам, такие как планирование встреч, поиск рейсов, доставка цветов вашему парню.

Какими бы полезными они ни были, во внутренней работе искусственных помощников есть много мистики. Они люди? Компьютер? Магия? Давайте определимся, как они работают.

Паттерн проектирования 1: активное обучение

В машинном обучении (контролируемая) модель изучается из набора обучающих данных, и использование ее на новых данных приводит к предсказанным значениям. В шаблоне проектирования активного обучения интегрированы контролируемое машинное обучение и принятие решений человеком. Задачи будут отправлены на компьютер, но когда он станет менее уверенным, для вынесения решения будет предложен человек.

Для непосвященных шаблон проектирования - это общая форма решения проблемы.

Это разумно снижает рабочую нагрузку. Вместо того, чтобы люди обрабатывали все данные, люди отслеживают только самые нетипичные или необычные случаи, или те, в которых компьютеру не хватает уверенности. Показатель достоверности определяет, доверено ли предсказание человеку или нет. Шаблон является «активным», потому что человеческое предсказание отправляется обратно в алгоритм, чтобы усилить его и улучшить его производительность.

Например, сообщение может быть разбито:

Мы переходим от обычного предложения на английском языке к структурированному запросу, как если бы он вводился в форму. Можно представить себе, как можно разговаривать с Интернетом таким образом, заполнять формы, просто используя английский язык, или разговаривать с Сири и просить ее забронировать для вас столик сегодня вечером. Это должно быть просто, правда?

Если только. Как извлеченные элементы связаны, комбинируются и ограничивают друг друга, совсем не просто. Вот как журналист интерпретирует как компьютер определяет ответ на запрос:

Здесь важно отметить, что этот запрос намного сложнее для компьютера, чем для человека. Компьютеру нужны разрозненные источники данных и возможность выбирать между вариантами, чтобы в конечном итоге прийти к рекомендации. Человек гораздо быстрее оценит нюансы задачи и сосредоточится на сочетании вин после небольшого колебания, чтобы понять оставшийся контекст. Человеческий интеллект создан для выявления именно такой сложности и нюансов в общении.

Давайте вкратце вернемся к первоначальной цели: уменьшить степень участия человека в интеллектуальных системах. Использование компьютера может позволить выполнять задачи быстрее и проще. Активное обучение позволяет нам масштабировать системы в 10 или 20 раз за пределы возможностей и эффективности людей.

Тем не менее, модель активного обучения не всегда адекватна, например, когда:

  • нюанс или двусмысленность в человеческом языке непонятен компьютеру.
  • Качество ответа важнее, чем задержка или время ответа.
  • Каждая задача должна быть подтверждена людьми, чтобы снизить риск или вред (подумайте о диагностике здравоохранения или системе уголовного правосудия).
  • Контекст должен сохраняться для нескольких задач
  • Для выполнения задачи требуется некоторая работа человека и некоторая работа компьютера.

Из-за этих проблем мы стали свидетелями возникновения еще одной модели, которая еще больше объединяет людей и компьютеры, обеспечивая разделение труда между задачами и полную проверку.

Паттерн проектирования 2: гибридное взаимодействие

В гибридном взаимодействии компьютер структурирует запрос и предлагает ответ, который человек затем решает отправить или перекомпоновать. Гибридное взаимодействие стало возможным благодаря более доступной распределенной рабочей силе людей, которые решают задачи по своему усмотрению.

В отличие от активного обучения, человек всегда принимает решение в конце процесса, но не всегда выполняет основную часть работы. Компьютер дает предполагаемый ответ, и человек решает, исправить ли его перед отправкой. Поскольку человек всегда проверяет конечный результат, система оптимизирует для более точного ответа, используя то, что лучше всего делает компьютер, и сочетая это с суждением и интуицией человека. .

Конечно, основной компромисс этого паттерна может быть очевиден. Чтобы повысить точность, используется меньшая пропускная способность (скорость обработки запросов) и более высокие человеческие усилия ( каждый запрос).

Интересно, что это решение возникло не в результате технологического прорыва. Лучшее, более интеллектуальное решение было создано путем объединения распределенных человеческих ресурсов с искусственным интеллектом и определения того, следует ли полагаться на компьютеры или людей для проверки.

Боты + Amazon Turk = Искусственные помощники

Технологии интеллекта можно визуализировать на основе того, насколько люди и компьютеры вовлечены в выполнение задач, от 0% до 100% для каждого. Это охватывает широкий спектр интеллектуальных возможностей - от заказа большего количества моющих средств и классификации новостей до бронирования отелей и получения технической поддержки.

На этом рисунке искусственные помощники относятся к гибридному взаимодействию, а обогащение корпоративных данных (показаны поставщики, хотя внутренние системы соответствуют требованиям) - к активному обучению. Хотя потребительские приложения (боты, искусственные помощники), вероятно, являются более узнаваемыми именами, управление корпоративными данными и виртуальные центры обработки вызовов являются прибыльными и в равной степени заслуживают внимания.

Итак, сколько работы делает компьютер?

Один из основателей компании, специализирующейся на искусственных помощниках, сказал мне, что 25% их работы выполняется через компьютер. Люди по-прежнему выполняют основную часть работы, около 75%. Хотя искусственные помощники плохо работают, нет оснований полагать, что они и дальше будут работать неэффективно. Любой инвестор скажет вам, что основное внимание уделяется инвестированию в ранние технологии по мере их продвижения в будущее.

Для искусственных помощников технологическая цель состоит в том, чтобы разделить работу на 90% компьютера и 10% человека. Как мы уже обсуждали, люди всегда будут частью уравнения, в конечном итоге имея дело с 10% самых сложных или непостижимых случаев. В этих случаях их работа будет не скучной или рутинной, а серьезными, тяжелыми делами. Это мечта.

Алекса мой друг

Но есть еще одна важная вещь, на которую следует обратить внимание, - это дизайн.

Приложения искусственного помощника антропоморфизируются, используя человеческие имена и взаимодействуя через естественный человеческий язык. Любого бота можно попросить рассказать анекдот или понравиться ли вы ему, всегда отвечая всегда спокойным тоном.

В этом и заключается трюк: люди умеют взаимодействовать с англоговорящей сущностью, которая нежно отвечает на добрые вопросы. Это знакомый интуитивно понятный интерфейс, которому нас впервые научили наши матери. Мы ожидаем, что компьютер нас поймет, и в ответ мы часто чувствуем благодарность, чувство, что о нас заботятся. Мы рассматриваем эти системы как единую искусственную личность и интеллект, хотя они представляют собой скоординированный танец запросов к базе данных, логики и редактирования, выполняемого многими людьми под одним гуманоидным именем. Это простая психологическая ловкость рук, и она работает. Когда Алекса говорит, что не понимает, мы признаем, что даем ей слишком мало информации и ожидаем, что она поправится. Мы относимся к ней как к обучающемуся ребенку. Это недалеко от реальности.

Создавайте гибридные продукты

По мере того, как мы пытаемся создать наиболее прибыльные, полезные и эффективные интеллектуальные технологии, самым важным становится вопрос: Как нам лучше всего обеспечить взаимодействие людей и компьютеров вместе? вера в то, что мы можем положить конец вмешательству человека в интеллектуальные технологии, нереалистична даже при наличии бесконечных ресурсов. Давайте сосредоточимся на развитии гибридного интеллекта, оптимально эффективной интеграции талантов людей и компьютеров. Если все сделано хорошо, мы составим самую умную команду.

Изначально это был доклад на конференции Человек + машины в Маниле, февраль 2016 г.