- Делаем метод на основе реконструкции снова эффективным для обнаружения аномалий видео (arXiv)
Автор: Ичжоу Ван, Цань Цинь, Юэ Бай, И Сюй, Сю Ма, Юнь Фу.
Аннотация: Обнаружение аномалий в видео является серьезной, но сложной проблемой. Предыдущие подходы, основанные на глубоких нейронных сетях, использовали подходы, основанные на реконструкции или прогнозировании. Тем не менее, существующие методы, основанные на реконструкции, 1) полагаются на устаревшие сверточные автокодировщики и плохо моделируют временную зависимость; 2) склонны к переобучению обучающих выборок, что приводит к неразличимым ошибкам реконструкции нормальных и аномальных кадров на этапе логического вывода. Чтобы решить такие проблемы, во-первых, мы черпаем вдохновение из трансформатора и предлагаем пространственно-временной автоматический транскодировщик, получивший название STATE, в качестве новой модели автокодировщика для улучшенной последовательной реконструкции кадров. Наше СОСТОЯНИЕ оснащено специально разработанным обучаемым модулем сверточного внимания для эффективного временного обучения и рассуждений. Во-вторых, мы предложили новый метод входных возмущений на основе реконструкции во время тестирования, чтобы дополнительно дифференцировать аномальные кадры. При одинаковой величине возмущения ошибка тестовой реконструкции нормальных кадров снижается больше, чем ошибка аномальных кадров, что способствует смягчению проблемы переобучения реконструкции. Из-за высокой значимости аномалии кадра и объектов в кадре мы проводим реконструкцию на уровне объекта, используя как необработанный кадр, так и соответствующие патчи оптического потока. Наконец, оценка аномалии рассчитывается на основе комбинации необработанных ошибок и ошибок реконструкции движения с использованием искаженных входных данных. Обширные эксперименты с эталонными наборами данных обнаружения аномалий видео показывают, что наш подход значительно превосходит предыдущие методы, основанные на реконструкции, и стабильно обеспечивает самую современную производительность обнаружения аномалий. Код доступен по адресу https://github.com/wyzjack/MRMGA4VAD.
2. Обнаружение аномалий глубокого промышленного изображения: обзор (arXiv)
Автор: Цзяци Лю, Гоян Се, Цзинбао Ван, Шаннянь Ли, Чэнцзе Ван, Фэн Чжэн, Яочу Цзинь.
Аннотация: Недавнее быстрое развитие глубокого обучения стало важной вехой в промышленном обнаружении аномалий изображения (IAD). В этой статье мы представляем всесторонний обзор методов обнаружения аномалий изображений на основе глубокого обучения с точки зрения архитектур нейронных сетей, уровней контроля, функций потерь, метрик и наборов данных. Кроме того, мы извлекаем новую настройку из промышленного производства и анализируем текущие подходы IAD в рамках предложенной нами новой настройки. Кроме того, мы выделяем несколько новых проблем для обнаружения аномалий изображения. Обсуждаются достоинства и недостатки репрезентативных сетевых архитектур под различным контролем. Наконец, мы подводим итоги исследования и указываем направления дальнейших исследований. Дополнительные ресурсы доступны по адресу https://github.com/M-3LAB/awesome-industrial-anomaly-detection.