Это еще не ИИ!
Сегодня мы слышим о крупных организациях, стремящихся внедрить ИИ в свой бизнес, но уровень обучения, демонстрируемый этими решениями, очень ограничен. Хотя цель этих решений похвальна, используемые ими подходы ограничены и не раскрывают сущность интеллекта или обучения, как утверждается.
Если вы возьмете пример Amazon Go, в котором говорится об объединении алгоритмов слияния датчиков, машинного зрения и глубокого обучения для достижения меньшего опыта на кассе. Хотя решение, заключающееся в том, чтобы предлагать меньше опыта при оформлении заказа, великолепно, добавление к нему тега глубокого обучения делает его претенциозным. Обнаружение покупателя, какой продукт был выбран покупателем, а какой продукт был оставлен, не требует глубокого обучения, но может быть получен с помощью простой функции состояния.
Если вы проанализируете достаточно глубоко, интеллект, необходимый для достижения этой цели, будет в высшей степени статичен. Идентификацию покупателя в магазине и отслеживание того, какой товар был выбран или возвращен, можно обнаружить, используя простую активную комбинацию состояний между данными, собранными из мобильного приложения, и связанным датчиком.
Просто чтобы объяснить проще, покупатель, который входит в магазин, обнаруживается с помощью датчиков (маяков/RFID). Когда продукт находится на месте (стойке), вы можете получить комбинацию по умолчанию, как показано в качестве первой комбинации. Когда продукт перемещается из зоны, показания продукта изменятся, так как он потеряет связь с определенной зоной. Более понятное объяснение того, как это делается, можно найти здесь.
Если датчики размещены стратегически и синхронизированы с мобильным приложением покупателя, вы можете определить поведение покупателя в браузере в магазине, используя функцию простого сопоставления для доступных комбинаций. Я действительно не понимаю, почему для понимания действий клиентов требуется глубокое обучение. Если Amazon пытается предсказать, что клиент может купить, и перестраивает выкладку продуктов на стеллаже, то вы можете извлечь уроки из прошлого поведения, чтобы сообщить стеллажам, чтобы они автоматически упорядочивали продукты внутри.
Другим крупным представителем глубокого обучения является Google, который демонстрирует свое глубокое обучение через свою программу AlphaGo, использующую обнаружение шаблонов и взвешивание связанных шаблонов для прогнозирования доступных ходов. Хотя это упражнение по глубокому обучению от Google обещает свою точность, этого нельзя сказать о его поисковом продукте. Продукт поиска ведет себя как обычная информационная система со случайной релевантностью.
Вы можете сами попробовать ответить на несколько вопросов. Надев роль ребенка, я искал «Могут ли черепахи летать?». Мне показали список ссылок, в которых была информация, которая просто не соответствовала контексту. Система обработки естественного языка с интеллектом будет выдавать ответы, говорящие: «Нет. Черепахи не могут летать, потому что…». и, возможно, список полезных ссылок.
Далее вы можете увидеть, что поиск Google выполняет прямо противоположное для таких запросов, как «Сколько союзных территорий в Индии, исключая Андаманские острова и Лакшадвип?». Результаты поиска, кажется, показывают только результаты, относящиеся к Андаманским островам и Лакшадвипу. Это ясно показывает, что не предпринимается никаких усилий для понимания простейших маркеров контекста. Запросы типа «Исключая север и запад, какие два других направления? просто вырвал ссылки из контекста.
Во всех этих сценариях поисковая система просто перечисляет все связанные ссылки. Можно сказать, что это скорее список информации, а не интеллектуальный поставщик ответов. Насколько я понимаю, инструменты знаний, которые используют НЛП для обработки машинного перевода естественного языка, поддерживают целостную иерархическую структуру данных с абсолютными отношениями, что помогает понять контекст, скрытый в данном предложении. Углубление в эту ссылку дало бы более четкое представление о том, что входит в создание разговорной машины.
Хотя мы можем понять, что AlphaGo является меньшей и менее динамичной программой, чем Google Search, реальная демонстрация обучения происходит в среде, где заданные параметры данных больше в количестве и имеют скрытые подсети. В этих средах шаблонов много, и для точного определения правильного шаблона требуется вычисление веса в нескольких узлах.
Если мы хотим ожидать серьезных прорывов с использованием ИИ, нам нужно вырасти за пределы этих игрушечных историй и приложить реальные усилия, чтобы соответствовать моделям мышления и рассуждений, демонстрируемым естественным интеллектом, чтобы соответствовать нашим целям ИИ.