ИИ во многом лучше людей.

Прогноз погоды? Проверять.

Диагностика болезни? Ага.

Шахматы? Вы делаете ставку.

Этот список можно продолжить, но суть в том, что ИИ лучше нас во многих вещах, кроме ответов на такие вопросы:

Какого размера цилиндр, оставшийся от коричневого металлического предмета, оставшегося от большой сферы?

Любой шестилетний ребенок может довольно легко ответить на этот вопрос, однако подобные вопросы выходят за рамки традиционных моделей глубокого обучения.

Почему глубокого обучения недостаточно

Модели глубокого обучения довольно хорошо понимают отношения между входами и выходами, но это все, что нужно. Будь то обучение с учителем или обучение с подкреплением, входные и желаемые выходные данные четко определены и просты для понимания модели. Это нормально для таких задач, как классификация и даже генерация, но если мы хотим, чтобы модели ИИ могли принимать решения, используя то, что мы называем «здравым смыслом», что на самом деле является абстрактным рассуждением, нам нужно дать им возможность рассуждать.

Глубокие рассуждения

Глубокое рассуждение - это область, позволяющая машинам понимать неявные отношения между разными вещами. Например, рассмотрим следующее: «Все животные пьют воду. Кошки - животные ». Здесь подразумевается, что все кошки пьют воду, но это никогда не оговаривалось явно. Оказывается, люди действительно хороши в таком реляционном рассуждении и понимании того, как разные вещи соотносятся друг с другом, но это не так легко дается компьютерам, которые работают по строгим, явным правилам.

Итак, как мы можем дать компьютерам способность рассуждать?

Реализация глубоких рассуждений

В этой статье исследователи DeepMind объяснили, как они получили модель глубокого обучения, чтобы отвечать на вопросы, подобные приведенному в начале этой статьи, с потрясающей точностью 96%.

Они сделали это, используя 3 сети:

  1. Сеть с долгосрочной краткосрочной памятью (LSTM) для обработки вопроса
  2. Сверточная нейронная сеть (CNN) для обработки изображения
  3. Сеть отношений (RN), чтобы понять, как разные объекты связаны друг с другом.

Давайте рассмотрим, как каждый из этих компонентов помогает решить проблему.

Языковая обработка

LSTM действительно хорошо понимают последовательности из-за их способности «запоминать» предыдущие части последовательности. Это действительно хорошо, когда вы имеете дело с вопросами и языком в целом, потому что начало предложения может повлиять на значение и / или значение конца. LSTM создает вложение вопроса, с которым RN легче работать.

Обработка изображений

CNN действительно хороши в эффективном распознавании особенностей изображений, поэтому исследователи использовали CNN для извлечения всех различных объектов из изображения в виде векторов карты признаков. Так же, как встраивание, производимое LSTM, векторы карты признаков - это просто более эффективное представление объектов, чем пиксели, что упрощает работу RN.

Реляционное понимание

После того, как модель обработала вопрос и изображение, она может начать понимать отношения между объектами на изображении и то, как использовать эти отношения для ответа на вопрос. RN учится выводить отношения, рассматривая потенциальные отношения между всеми парами объектов (например, красным цилиндром и синим кубом). Эти выходные данные затем проходят через многослойный перцептрон (MLP), своего рода нейронную сеть с прямой связью, а затем эти выходные данные суммируются и пропускаются через окончательный MLP, который выводит ответ.

Фух, это немного сбивало с толку. Вот диаграмма, которая обрисовывает схему всей модели:

Приложения

Вот несколько потенциальных приложений, позволяющих моделировать глубокое обучение:

  1. Богатое понимание сцены в RL-агентах. Позволив агентам понять, как связаны различные части их среды, они смогут вести себя более разумно и по-человечески.
  2. Моделирование социальных сетей
  3. Решение абстрактных задач

Выводы

  • Глубокие рассуждения позволяют ИИ понимать абстрактные отношения между разными «вещами».
  • Модуль «сети отношений» можно легко подключить к модели глубокого обучения, чтобы дать ей возможности реляционного мышления.
  • Глубокие рассуждения - это следующий шаг на пути к общему искусственному интеллекту.

Если вам понравилась эта статья, не стесняйтесь связаться со мной в LinkedIn и загляните на мой личный веб-сайт, где вы можете увидеть другие мои проекты и подписаться на мою рассылку! Спасибо!