Центр науки о данных профессор Кайл Кранмер рассказывает о GAN и VAE
В настоящее время существует два основных подхода к созданию изображений с использованием искусственного интеллекта: генеративные состязательные сети (GAN) и вариационное автокодирование (VAE).
GAN противопоставляет две нейронные сети друг другу, чтобы улучшить качество их создания фотореалистичных изображений. В GAN есть генератор, который производит поддельные изображения, и дискриминатор, который отличает поддельные изображения от настоящих. Они тренируются вместе: дискриминатор обрабатывает различия между реальным и поддельным изображениями и сообщает генератору, как создавать более точные поддельные изображения. В идеале, по мере продолжения процесса GAN, генератор в конечном итоге будет создавать все более и более качественные поддельные изображения, чтобы дискриминатор больше не мог различать. С точки зрения эффективности, GAN также приносят пользу исследователям, потому что для них требуются только сотни обучающих изображений, тогда как для сетей распознавания изображений требуются десятки тысяч, по словам его создателя Яна Гудфеллоу, ученого-информатика из Open-AI в Сан-Франциско.
VAE, однако, - это еще один подход к созданию изображений, сильная сторона которого заключается в разнообразии создаваемых изображений. Хотя и с меньшим качеством, некоторые исследователи объединили VAE и GAN в гибрид с целью создания улучшенной генеративной модели.
Эти генеративные модели прошли долгий путь. Как недавно объяснил профессор Центра Кайл Кранмер в статье для Nature, существует разрыв между теорией и практической разработкой нейронных сетей. В настоящее время нейронные сети дают хорошие результаты, но как они это делают, все еще остается черным ящиком. Изначально нейронные сети включали ввод и предсказание. Но теперь генеративные сети создают изображения собак, кошек или галактик, которые выглядят реальными, что говорит о том, что их понимание создания представлений реального мира улучшилось, тем самым ослабляя некоторые опасения ученых по поводу их природы черного ящика.
Фотореалистичные изображения, создаваемые генеративными моделями, чрезвычайно полезны для ученых и исследователей, которым необходимо выполнить реконструкцию изображений или заполнить деформации изображений посредством моделирования. Применение этой технологии, как отмечает Кранмер, «довольно бесконечно». В более широком смысле, генеративные сети также могут использоваться для обучения программного обеспечения распознавания изображений, потому что способ, которым нейронная сеть в конечном итоге распознает и классифицирует только данные, - это процесс обучения с исходным набором данных, который указывает ее виртуальные нейроны.
Найла Аль-Мамлук
Первоначально опубликовано на cds.nyu.edu 24 марта 2017 г.