Полные архитектурные детали всех моделей EfficientNet

Давайте углубимся в архитектурные детали всех различных моделей EfficientNet и выясним, чем они отличаются друг от друга.

Я просматривал записные книжки в соревновании Kaggle и обнаружил, что почти все используют EfficientNet в качестве основы, о которой я не слышал до этого. Он представлен в этой статье Google AI, и они попытались предложить метод, который более эффективен, как следует из его названия, при этом улучшая современные результаты. Как правило, модели делаются слишком широкими, глубокими или с очень высоким разрешением. Повышение этих характеристик помогает модели на начальном этапе, но она быстро насыщается, и созданная модель просто имеет больше параметров и, следовательно, неэффективна. В EfficientNet они масштабируются более принципиально, т.е. постепенно все увеличивается.

Не понял в чем дело? Не волнуйтесь, вы увидите эту архитектуру. Но сначала давайте посмотрим, какие результаты они получили.

Благодаря значительно меньшему количеству параметров семейство моделей эффективно и дает лучшие результаты. Итак, теперь мы увидели, почему они могут стать стандартной предварительно обученной моделью, но чего-то не хватает. Я помню статью Рэйми Карима, в которой он показал архитектуры предварительно обученных моделей, и это очень помогло мне понять их и создать похожие архитектуры.

Иллюстрировано: 10 архитектур CNN
Скомпилированная визуализация общих сверточных нейронных сетей в сторонуdatascience.com

Так как я не смог найти такой в сети, я решил разобраться в нем и создать его для всех вас.

Общие вещи во всем

В первую очередь любая сеть - это ее основа, после чего начинается все экспериментирование с архитектурой, общее для всех восьми моделей и последних слоев.

После этого в каждом из них будет по 7 блоков. Эти блоки также имеют различное количество подблоков, количество которых увеличивается по мере перехода от EfficientNetB0 к EfficientNetB7. Чтобы посмотреть на слои моделей в Colab, напишите этот код:

!pip install tf-nightly-gpu
import tensorflow as tf
IMG_SHAPE = (224, 224, 3)
model0 = tf.keras.applications.EfficientNetB0(input_shape=IMG_SHAPE, include_top=False, weights="imagenet")
tf.keras.utils.plot_model(model0) # to draw and visualize
model0.summary() # to see the list of layers and parameters

Если вы посчитаете общее количество слоев в EfficientNet-B0, то всего будет 237, а в EfficientNet-B7 - 813 !! Но не волнуйтесь, все эти слои могут состоять из 5 модулей, показанных ниже, и стебля вверху.

Модуль 1 - используется в качестве отправной точки для подблоков.
Модуль 2 - используется в качестве отправной точки для первого подблока из всех 7 основных блоков, кроме 1-го.
Модуль 3 - подключается как пропускное соединение ко всем субблокам.
Модуль 4 - используется для объединения пропуска соединения в первых подблоках.
Модуль 5 - каждый субблок соединен со своим предыдущим субблоком в пропущенном соединении, и они объединяются с помощью этого модуля.

Эти модули далее объединяются в подблоки, которые будут определенным образом использоваться в блоках.

Подблок 1 - используется только как первый подблок в первом блоке.
Подблок 2 - используется как первый подблок во всех остальных блоках.
Подблок 3 - используется для любого подблока, кроме первого, во всех блоках.

До сих пор мы указали все, что будет объединено для создания моделей EfficientNet, так что приступим.

EfficientNet-B0

EfficientNet-B1

EfficientNet-B2

Его архитектура такая же, как у вышеупомянутой модели, единственное различие между ними состоит в том, что количество карт функций (каналов) варьируется, что увеличивает количество параметров.

EfficientNet-B3

EfficientNet-B4

EfficientNet-B5

EfficientNet-B6

EfficientNet-B7

Легко увидеть разницу между всеми моделями, и они постепенно увеличивали количество подблоков. Если вы разбираетесь в архитектуре, я рекомендую вам взять любую модель, распечатать ее краткое изложение и просмотреть ее, чтобы узнать ее более тщательно. В приведенной ниже таблице указан размер ядра для операций свертки, а также разрешение, каналы и уровни в EfficientNet-B0.

Эта таблица была включена в исходный документ. Разрешение остается таким же, как и для всей семьи. Я не знаю, изменится ли размер ядра или останется прежним, поэтому, если кто-нибудь знает, оставьте ответ. Количество слоев уже указано выше на рисунках. Количество каналов различается, и оно рассчитывается на основе информации, полученной в сводке каждой модели, и представлено ниже (Если вы используете мобильное устройство, вам нужно будет просматривать его в альбомном режиме.)

╔═══════╦══════╦══════╦══════╦══════╦══════╦══════╦══════╗
║ Stage ║  B1  ║  B2  ║  B3  ║  B4  ║  B5  ║  B6  ║  B7  ║
╠═══════╬══════╬══════╬══════╬══════╬══════╬══════╬══════╣
║     1 ║   32 ║   32 ║   40 ║   48 ║   48 ║   56 ║   64 ║
║     2 ║   16 ║   16 ║   24 ║   24 ║   24 ║   32 ║   32 ║
║     3 ║   24 ║   24 ║   32 ║   32 ║   40 ║   40 ║   48 ║
║     4 ║   40 ║   48 ║   48 ║   56 ║   64 ║   72 ║   80 ║
║     5 ║   80 ║   88 ║   96 ║  112 ║  128 ║  144 ║  160 ║
║     6 ║  112 ║  120 ║  136 ║  160 ║  176 ║  200 ║  224 ║
║     7 ║  192 ║  208 ║  232 ║  272 ║  304 ║  344 ║  384 ║
║     8 ║  320 ║  352 ║  384 ║  448 ║  512 ║  576 ║  640 ║
║     9 ║ 1280 ║ 1408 ║ 1536 ║ 1792 ║ 2048 ║ 2304 ║ 2560 ║
╚═══════╩══════╩══════╩══════╩══════╩══════╩══════╩══════╝

Medium не имеет никакого формата для создания таблиц, поэтому, если вы хотите создавать таблицы, подобные приведенной выше, вы создаете таблицы ASCII с этого сайта.

Прежде чем закончить, я снова приложил еще одно изображение из его исследовательской работы, которое показывает его эффективность по сравнению с другими современными методами, а также уменьшает количество параметров и количество требуемых FLOPS.

Если вы хотите создать подобную продвинутую архитектуру CNN или у вас возникли проблемы с пониманием каких-либо слоев или используемых терминов, не волнуйтесь, я написал статью, которая решит эти проблемы.

Помимо стандартной CNN в Tensorflow 2
Создавайте более глубокие модели со сложной архитектурой и узнавайте о различных уровнях, которые делают модель лучше. кdatascience.com

Хотите узнать, как EfficientNet соотносится с моделями в испытании Kaggle? Вы можете проверить эту статью.

EfficientNet должен быть предварительно обученной моделью goto или…
Сравните время и точность различных предварительно обученных моделей и, наконец, создайте ансамбль для улучшения результатов. todatascience.com

смотрите также:

Новые материалы

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

ИИ в аэрокосмической отрасли

Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Data Visualization Neural Networks Startup Tutorial Statistics Productivity Reactjs Learning