- LXL: LiDAR исключает обнаружение 3D-объектов Lean с помощью радара 4D-изображения и объединения камер (arXiv)
Автор: Вэйи Сюн, Цзянан Лю, Тао Хуан, Цин-Лун Хань, Юсюань Ся, Бин Чжу.
Аннотация: В качестве новой технологии и относительно доступного устройства радар с 4D-изображением уже доказал свою эффективность при обнаружении 3D-объектов при автономном вождении. Тем не менее, разреженность и зашумленность облаков точек 4D радара препятствуют дальнейшему повышению производительности, а углубленные исследования их слияния с другими модальностями отсутствуют. С другой стороны, большинство методов восприятия на основе камеры преобразуют извлеченные особенности перспективы изображения в вид с высоты птичьего полета геометрически с помощью «разбрызгивания на основе глубины», предложенного в Lift-Splat-Shoot (LSS), а некоторые исследователи используют другие методы. модалы, такие как лидары или обычные автомобильные радары для улучшения. В последнее время в нескольких работах применялась стратегия «выборки» для преобразования вида изображения, показывая, что она превосходит «разбрызгивание» даже без предсказания глубины изображения. Однако потенциал «сэмплинга» раскрыт не полностью. В этой статье мы исследуем стратегию преобразования вида «выборки» при обнаружении 3D-объектов на основе слияния камеры и 4D-радара. В предлагаемой модели LXL прогнозируемые карты распределения глубины изображения и трехмерные сетки занятости радара используются для облегчения преобразования вида изображения, называемого «выборкой на основе глубины с помощью радара». Эксперименты с наборами данных VoD и TJ4DRadSet показывают, что предлагаемый метод значительно превосходит существующие методы обнаружения 3D-объектов без наворотов. Исследования абляции показывают, что наш метод работает лучше всего среди различных настроек усиления.
2. SSC3OD: совместное обнаружение 3D-объектов с редким контролем из облаков точек LiDAR (arXiv)
Автор: Юшань Хань, Хуэй Чжан, Хонглей Чжан, Йидун Ли.
Аннотация: Совместное обнаружение 3D-объектов с его улучшенным преимуществом взаимодействия между несколькими агентами широко исследуется в автономном вождении. Однако существующие совместные детекторы 3D-объектов в полностью контролируемой парадигме в значительной степени зависят от крупномасштабных аннотированных 3D-ограничивающих рамок, что требует больших затрат труда и времени. Чтобы решить эту проблему, мы предлагаем совместную систему обнаружения 3D-объектов с редким контролем SSC3OD, которая требует от каждого агента случайной маркировки только одного объекта в сцене. В частности, эта модель состоит из двух новых компонентов, т. е. маскированного автокодировщика на основе столпов (Pillar-MAE) и модуля интеллектуального анализа экземпляров. Модуль Pillar-MAE предназначен для анализа высокоуровневой семантики в режиме самоконтроля, а модуль интеллектуального анализа экземпляров генерирует высококачественные псевдометки для совместных детекторов в режиме онлайн. Внедряя эти простые, но эффективные механизмы, предлагаемый SSC3OD может смягчить неблагоприятное воздействие неполных аннотаций. Мы создаем разреженные метки на основе наборов данных совместного восприятия для оценки нашего метода. Обширные эксперименты с тремя крупномасштабными наборами данных показывают, что предлагаемый нами SSC3OD может эффективно улучшить производительность совместных детекторов 3D-объектов с редким контролем.