- Улучшение анализа цветных изображений с использованием нового гибридного алгоритма распознавания лиц на основе дискретных вейвлетов и полиномов Чебышева (arXiv)
Автор: Хасан Мохамед Мухи-Алдин, Маха Аммар Мустафа, Асма А. Абдулрахман, Джаббар Абед Элейви, Фуад С. Тахир, Юрий Хлапонин.
Аннотация: Эта работа уникальна тем, что использует дискретные вейвлеты, которые были построены или получены из полиномов Чебышева второго и третьего рода, фильтруют дискретное второе вейвлет-преобразование Чебышева (DSCWT) и получают два эффективных фильтра. Фильтр дискретного третьего вейвлет-преобразования Чебышева (FDTCWT) используется в процессе анализа цветных изображений и удаления шумов и примесей, сопровождающих изображение, а также из-за большого объема данных, из которых состоит изображение в момент его съемки. Эти данные огромны, что затрудняет взаимодействие друг с другом во время передачи. Однако для решения этой проблемы используется метод сжатия изображения, при котором изображение не теряет информацию из-за полученных показаний, и результаты были удовлетворительными. Среднеквадратическая ошибка (MSE), пиковое отношение сигнал-шум (PSNR), бит на пиксель (BPP) и коэффициент сжатия (CR). Коронавирус — это начальная обработка, а этап обработки выполняется с обучением сети для сверточных нейронных сетей (CNN) с дискретной сверточной нейронной сетью вторых вейвлетов Чебешева (DSCWCNN) и сверточной нейронной сетью дискретных третьих вейвлетов Чебешева (DTCWCNN) для создания эффективного алгоритма распознавания лиц, и были достигнуты наилучшие результаты по точности и за наименьшее количество времени. Были использованы два образца цветных изображений, которые были изготовлены или реализованы. Предложенная теория была получена с быстрыми и хорошими результатами; результаты очевидны, показаны в таблицах ниже
2. Управляемая инверсия моделей распознавания лиц «черный ящик» с помощью диффузии (arXiv)
Автор: Мануэль Канси, Антон Раэль, Грациана Миньоне, Яцек Нарунец, Кристофер Шроерс, Маркус Гросс, Романн М. Вебер.
Аннотация: модели распознавания лиц встраивают изображение лица в низкоразмерный вектор идентичности, содержащий абстрактные коды характерных для идентичности черт лица, которые позволяют отличать людей друг от друга. Мы решаем сложную задачу инвертирования скрытого пространства предварительно обученных моделей распознавания лиц без полного доступа к модели (т. Е. Настройка черного ящика). В литературе было предложено множество методов для этой задачи, но они имеют серьезные недостатки, такие как отсутствие реалистичных результатов, длительное время вывода и жесткие требования к набору данных и доступности модели распознавания лиц. Путем анализа проблемы инверсии черного ящика мы показываем, что потери модели условной диффузии возникают естественным образом и что мы можем эффективно выбирать из обратного распределения даже без потерь, специфичных для идентичности. Наш метод, названный вероятностной моделью диффузии с шумоподавлением (ID3PM), использует стохастический характер процесса диффузии с шумоподавлением для создания высококачественных, сохраняющих идентичность изображений лиц с различным фоном, освещением, позами и выражениями. Мы демонстрируем современную производительность с точки зрения сохранения идентичности и разнообразия как в качественном, так и в количественном отношении. Наш метод является первым методом инверсии модели распознавания лиц методом черного ящика, который предлагает интуитивно понятный контроль над процессом генерации и не имеет каких-либо общих недостатков конкурирующих методов.