- Преподаватель с двумя учебными планами по обнаружению несовместимых с предметной областью объектов в автономном вождении(arXiv)
Автор: Лунхуэй Юй, Ифань Чжан, Ланьцин Хун, Фей Чен, Чжэнго Ли
Аннотация. Обнаружение объектов для автономных транспортных средств в последние годы привлекает все большее внимание, когда размеченные данные часто обходятся дорого, а неразмеченные данные могут быть легко собраны, что требует исследований в области полуконтролируемого обучения в этой области. Существующие методы полуконтролируемого обнаружения объектов (SSOD) обычно предполагают, что помеченные и немаркированные данные поступают из одного и того же распределения данных. Однако при автономном вождении данные обычно собираются из разных сценариев, таких как разные погодные условия или разное время суток. Руководствуясь этим, мы изучаем новую, но сложную проблему несовместимости доменов SSOD. Он включает в себя два вида сдвигов распределения между различными областями, включая (1) несоответствие распределения данных и (2) сдвиги распределения классов, из-за чего существующие методы SSOD страдают от неточных псевдометок и снижают производительность модели. Для решения этой проблемы мы предлагаем новый метод, а именно учитель с двойным учебным планом (DucTeacher). В частности, DucTeacher состоит из двух учебных программ, т. е. (1) учебная программа, развивающаяся в предметной области, стремится постепенно учиться на данных, чтобы справляться с расхождениями в распределении данных, оценивая сходство между областями, и (2) учебная программа по сопоставлению распределения стремится оценить распределение классов для каждой области. непомеченный домен для обработки сдвигов распределения классов. Таким образом, DucTeacher может калибровать необъективные псевдометки и эффективно справляться с проблемой несовместимости домена SSOD. DucTeacher демонстрирует свои преимущества на SODA10M, крупнейшем общедоступном наборе данных для полуконтролируемого автономного вождения, и COCO, широко используемом эталонном тесте SSOD. Эксперименты показывают, что DucTeacher достигает нового современного уровня производительности на SODA10M с улучшением на 2,2 mAP и на COCO с улучшением на 0,8 mAP.
2. Размерность наборов данных в сетях обнаружения объектов(arXiv)
Автор: Аджай Чавда, Аксель Вирлинг, Карстен Бернс
Аннотация: В последние годы сверточные нейронные сети (CNN) используются в большом количестве задач компьютерного зрения. Один из них — обнаружение объектов для автономного вождения. Хотя CNN широко используются во многих областях, то, что происходит внутри сети, до сих пор остается необъяснимым на многих уровнях. Наша цель — определить влияние внутренней размерности (т. е. минимального количества параметров, необходимых для представления данных) в разных слоях на точность сети обнаружения объектов для расширенных наборов данных. Наше исследование определяет, что существует разница между представлением обычных и дополненных данных во время извлечения признаков.
3.H2RBox: аннотация горизонтальной рамки — это все, что вам нужно для обнаружения ориентированных объектов(arXiv)
Автор:Сюэ Ян, Гефан Чжан, Вентонг Ли, Сюэхуэй Ван, Юэ Чжоу, Цзюньчи Ян
Аннотация. Ориентированное обнаружение объектов появляется во многих приложениях, от аэрофотоснимков до автономного вождения, в то время как многие существующие эталонные тесты обнаружения снабжены аннотациями только с горизонтальной ограничивающей рамкой, которая также менее затратна, чем детальная повернутая рамка, что приводит к разрыв между легкодоступным учебным корпусом и растущим спросом на ориентированное обнаружение объектов. В этой статье предлагается простой, но эффективный ориентированный подход к обнаружению объектов под названием H2RBox, просто использующий аннотацию горизонтального блока для обучения со слабым наблюдением, который устраняет указанный выше пробел и демонстрирует конкурентоспособность даже по сравнению с теми, кто обучался с повернутыми блоками. Ядром нашего метода является слабое и самоконтролируемое обучение, которое предсказывает угол объекта, изучая согласованность двух разных взглядов. Насколько нам известно, H2RBox — это первый ориентированный детектор объектов на основе горизонтальных рамок, основанный на аннотациях. По сравнению с альтернативой, т. е. горизонтальной сегментацией экземпляров с контролируемым блоком с нашей пост-адаптацией к обнаружению ориентированных объектов, наш подход не зависит от качества прогнозирования маски и может работать более надежно в сложных сценах, содержащих большое количество плотных объектов и выбросов. Экспериментальные результаты показывают, что H2RBox имеет значительные преимущества в производительности и скорости по сравнению с горизонтальными методами сегментации экземпляров, контролируемых блоками, а также более низкие требования к памяти. По сравнению с детекторами ориентированных объектов с вращающимся ящиком, наш метод показывает очень близкие характеристики и скорость, а в некоторых случаях даже превосходит их. Исходный код доступен по адресу https://github.com/yangxue0827/h2rbox-mmrotat.