- Увеличение данных изображения для глубокого обучения: опрос (arXiv)
Автор: Суоронг Ян, Вейкан Сяо, Мэнчэн Чжан, Сухан Го, Цзянь Чжао, Фурао Шэнь.
Аннотация: Глубокое обучение достигло замечательных результатов во многих задачах компьютерного зрения. Глубокие нейронные сети обычно полагаются на большие объемы обучающих данных, чтобы избежать переобучения. Однако помеченные данные для реальных приложений могут быть ограничены. За счет увеличения количества и разнообразия обучающих данных дополнение данных стало неизбежной частью обучения моделей глубокого обучения с данными изображений. Расширение данных как эффективный способ повысить достаточность и разнообразие обучающих данных стало необходимой частью успешного применения моделей глубокого обучения к данным изображений. В этой статье мы систематически рассматриваем различные методы увеличения данных изображения. Мы предлагаем таксономию рассмотренных методов и представляем сильные и слабые стороны этих методов. Мы также проводим обширные эксперименты с различными методами увеличения данных для трех типичных задач компьютерного зрения, включая семантическую сегментацию, классификацию изображений и обнаружение объектов. Наконец, мы обсудим текущие проблемы, с которыми сталкивается расширение данных, и будущие направления исследований, чтобы предложить некоторые полезные рекомендации для исследований.
2. Генеративные состязательные сети для увеличения изображения в сельском хозяйстве: систематический обзор (arXiv)
Автор: Эбенезер Оланийи, Донг Чен, Юйчжэнь Лу, Янбо Хуанг.
Резюме: В анализе сельскохозяйственных изображений оптимальная производительность модели направлена на лучшее выполнение задач визуального распознавания (например, классификация изображений, сегментация, обнаружение и локализация объектов) в условиях проблем с биологической изменчивостью и неструктурированной средой. Однако часто бывает трудно получить крупномасштабные, сбалансированные и достоверные наборы данных изображений, чтобы способствовать разработке передовых высокопроизводительных моделей. Поскольку искусственный интеллект посредством глубокого обучения влияет на анализ и моделирование сельскохозяйственных изображений, дополнение данных играет решающую роль в повышении производительности модели при одновременном сокращении ручных усилий по подготовке данных за счет алгоритмического расширения наборов обучающих данных. Помимо традиционных методов увеличения данных, генеративно-состязательная сеть (GAN), изобретенная в 2014 году в сообществе компьютерного зрения, предлагает набор новых подходов, которые могут изучать хорошие представления данных и генерировать очень реалистичные образцы. С 2017 года наблюдается рост исследований GAN для увеличения или синтеза изображений в сельском хозяйстве для повышения производительности моделей. В этом документе представлен обзор эволюции архитектур GAN, за которым следует систематический обзор их применения в сельском хозяйстве (https://github.com/Derekabc/GANs-Agriculture), включая различные задачи видения для здоровья растений, сорняков, фруктов, аквакультуры. , животноводство, фенотипирование растений, а также послеуборочное выявление дефектов плодов. Проблемы и возможности GAN обсуждаются для будущих исследований