Вариационный автоэнкодер: введение и пример

Генерация невидимых изображений с помощью вариационных автоэнкодеров

Как вы, возможно, уже знаете, классические автокодеры широко используются для обучения представлению посредством реконструкции изображений. Однако есть много других типов автоэнкодеров, используемых для множества задач. Тема этой статьи - вариационные автоэнкодеры (VAE). Как видно на рисунке ниже, VAE также пытается восстановить входное изображение; однако, в отличие от обычных автокодировщиков, кодер теперь выдает два вектора, с помощью которых декодер восстанавливает изображение. Таким образом, учитывая распределение, мы можем выбрать случайный шум и создать реалистичные изображения.

Принцип VAE

Цель VAE - создать реалистичное изображение с учетом случайного вектора, который генерируется из заранее определенного распределения. Это было невозможно с простыми автокодировщиками, которые я рассмотрел в прошлый раз, поскольку мы не указали распределение данных, которые генерируют изображение. Таким образом, стратегия такова:

Кодировщик берет изображение и выводит два вектора, каждый из которых представляет среднее значение и стандартное отклонение.
Мы суммируем вектор среднего и вектор стандартного отклонения, который сначала умножается на случайное малое значение в качестве шума, и получаем модифицированный вектор, который имеет тот же размер.
Декодер берет измененный вектор и пытается восстановить изображение.
Величина потерь, которую мы пытаемся оптимизировать, представляет собой комбинацию расстояния L2 и дивергенции KL, которая измеряет отклонение распределения среднего и векторов стандартного отклонения от 0 и 1 соответственно.

Таким образом, мы рекомендуем, чтобы наш средний вектор имел распределение с центром вокруг 0, тогда как последний вектор должен быть с центром вокруг 1 (гауссовское распределение). Наконец, наш декодер сможет генерировать реалистичные изображения из случайного шума (векторов), генерируемого со средним значением 0 и стандартным отклонением 1.

KL дивергенция

Мы используем дивергенцию KL, чтобы вычислить, насколько наши векторы признаков отличаются от желаемого распределения значений, имеющих среднее значение 0 и стандартное распределение 1. Потери рассчитываются следующим образом:

где сигма и мю - стандартное отклонение и среднее значение соответственно. Как видно, цель состоит в том, чтобы сделать среднее значение (mu) как можно ближе к 0 (возведением значения в квадрат). В то время как остальная часть уравнения гарантирует, что стандартное отклонение (сигма) близко к 1. Обратите внимание, что мы используем логарифм, чтобы убедиться, что стандартное отклонение не является отрицательным.

Пример

Модель, которую я собираюсь использовать, выглядит следующим образом:

Как видно, наш кодировщик выводит журнал дисперсии вместо вектора стандартного отклонения, поэтому будьте осторожны. Пример был запущен на наборе данных MNIST Digit. Наконец, функция потерь выглядит следующим образом:

Вуаля! После всего 10 эпох обучения наш декодер смог создать очень реалистичные изображения случайного шума со средним значением 0 и стандартным отклонением 1 (может быть сгенерировано с помощью функции torch.randn).

Несколько последних слов

Вариационный автоэнкодер - довольно простой, но интересный алгоритм. Я надеюсь, что вам будет легко следовать за мной, но не торопитесь и убедитесь, что вы понимаете все, что мы рассмотрели. Помимо VAE, существует множество типов автоэнкодеров. Не стесняйтесь изучать другие автоэнкодеры самостоятельно, перейдя по приведенной ниже ссылке. Спасибо!

Автоэнкодеры: введение и практическое применение
Автоэнкодеры, вероятно, первые нейронные сети, которые приходят на ум, когда мы думаем о неконтролируемом обучении… todatascience.com

От Autoencoder к Beta-VAE
Автокодеры - это семейство моделей нейронных сетей, предназначенных для изучения сжатых скрытых переменных многомерных данных… lilianweng.github.io

смотрите также:

Новые материалы

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning