1. iFS-RCNN: инкрементный сегментатор экземпляров с несколькими выстрелами(arXiv)

Автор : Хой Нгуен, Синиса Тодорович

Аннотация. В этом документе рассматривается инкрементная сегментация нескольких экземпляров, когда появляется несколько примеров новых классов объектов, когда доступ к обучающим примерам старых классов больше недоступен, и цель состоит в том, чтобы хорошо работать в обоих случаях. старые и новые классы. Мы делаем два вклада, расширяя общую структуру Mask-RCNN на ее втором этапе, а именно, мы указываем новый классификатор класса объектов на основе пробит-функции и новый предсказатель ограничивающей рамки, основанный на неопределенности. Первый использует байесовское обучение для решения проблемы нехватки обучающих примеров новых классов. Последний учится не только прогнозировать ограничивающие рамки объекта, но и оценивать неопределенность прогноза в качестве руководства для уточнения ограничивающей рамки. Мы также определяем две новые функции потерь в терминах предполагаемого распределения классов объектов и неопределенности ограничивающей рамки. Наш вклад дает значительный прирост производительности набора данных COCO по сравнению с современным уровнем техники — в частности, прирост +6 для новых классов и +16 для старых классов в метрике сегментации экземпляра AP. Кроме того, мы первыми оценили пошаговую настройку нескольких выстрелов на более сложном наборе данных LVIS.

2. CDNet — это все, что вам нужно: Cascade DCN для обнаружения подводных объектов RCNN(arXiv)

Автор:Ди Чанг

Аннотация:Обнаружение объектов — очень важное направление фундаментальных исследований в области компьютерного зрения и базовый метод для решения других передовых задач в области компьютерного зрения. Он широко используется в практических приложениях, таких как отслеживание объектов, распознавание поведения видео и видение подводной робототехники. Cascade-RCNN и Deformable Convolution Network являются классическими и превосходными алгоритмами обнаружения объектов. В этом отчете мы оцениваем наш метод, основанный на Cascade-DCN, на наборах данных подводных оптических изображений и акустических изображений с различными инженерными приемами и дополнениями.

3. Надежное обнаружение митоза с использованием подхода Cascade Mask-RCNN с дополнением данных доменно-специфического остаточного цикла-GAN(arXiv)

Автор:Готье Рой, Жюль Дедье, Капуцин Бертран, Алиреза Мошайеди, Али Мамедов, Стефани Пети, Сайма Бен Хадж, Рутгер Х. Дж. Фик

Аннотация: Для задачи обнаружения митоза MIDOG мы создали каскадный алгоритм, состоящий из детектора Mask-RCNN, за которым следует ансамбль классификации, состоящий из ResNet50 и DenseNet201, для уточнения обнаруженных митотических кандидатов. Данные обучения MIDOG состоят из 200 кадров, полученных от четырех сканеров, три из которых аннотированы для митотических экземпляров с аннотациями центроида. Наши основные алгоритмы выбора заключаются в следующем: во-первых, чтобы повысить обобщаемость наших детекторных и классификационных сетей, мы используем современный остаточный Cycle-GAN для преобразования каждого домена сканера в любой другой домен сканера. Затем во время обучения мы случайным образом загружаем для каждого изображения один из четырех доменов. Таким образом, наши сети могут учиться на четвертом неаннотированном домене сканера, даже если у нас нет для него аннотаций. Во-вторых, для обучения сети детекторов вместо использования ограничивающих рамок фиксированного размера на основе центроидов мы создаем ограничивающие рамки, специфичные для митоза. Мы делаем это, вручную аннотируя небольшой набор митозов, обучая Mask-RCNN на этом небольшом наборе данных и применяя его к остальным данным для получения полных аннотаций. Мы обучили ансамбль последующей классификации, используя только положительные и строго отрицательные примеры. На предварительном тестовом наборе алгоритм набрал 0,7578 балла F1, что поставило нас на второе место в таблице лидеров.