- Эффективная самостоятельная проверка говорящего с помощью меток с максимизацией информации и контрастным обучением (arXiv)
Автор:Тео Лепаж, Реда Дехак
Аннотация. Современные системы проверки говорящих по своей сути зависят от человеческого контроля, поскольку они обучаются на огромных объемах размеченных данных. Однако аннотирование высказываний вручную является медленным, дорогим и не масштабируемым до объема данных, доступных сегодня. В этом исследовании мы изучаем самоконтролируемое обучение для проверки говорящего, изучая представления непосредственно из необработанного звука. Цель состоит в том, чтобы создать надежные вложения динамиков, которые имеют малую дисперсию внутри динамика и большую дисперсию между динамиками. Наш подход основан на последних методах обучения максимизации информации и интенсивном этапе предварительной обработки данных. Мы оцениваем способность этих методов работать без контрастных образцов, прежде чем показать, что они достигают лучших результатов в сочетании с контрастными потерями. Кроме того, мы проводим эксперименты, чтобы показать, что наш метод дает конкурентоспособные результаты по сравнению с существующими методами и может обеспечить более высокие характеристики по сравнению с контролируемым базовым уровнем при точной настройке с небольшой частью размеченных данных.
2. Эффективное по меткам федеративное обучение с самоконтролем для решения проблемы неоднородности данных в медицинской визуализации (arXiv)
Автор: Жуй Янь, Лянцюн Цюй, Цинюэ Вэй, Ши-Чэн Хуан, Лиюэ Шэнь, Даниэль Рубин, Лэй Син, Юинь Чжоу
Аннотация. Курирование крупномасштабных наборов медицинских данных из нескольких учреждений, необходимых для обучения моделей глубокого обучения, затруднено из-за сложности обмена данными пациентов с сохранением конфиденциальности. Федеративное обучение (FL), парадигма, которая обеспечивает защищенное конфиденциальностью совместное обучение между различными учреждениями, является многообещающим решением этой проблемы. Тем не менее, FL обычно страдает от снижения производительности из-за разнородного распределения данных между учреждениями и отсутствия качественных помеченных данных. В этой статье мы представляем надежную и эффективную маркировку FL с самоконтролем для анализа медицинских изображений. В частности, мы вводим новую парадигму распределенного самоконтролируемого предварительного обучения в существующий конвейер FL (т. е. предварительное обучение моделей непосредственно на децентрализованных наборах данных целевых задач). Основываясь на недавнем успехе Vision Transformers, мы используем задачи кодирования маскированных изображений для самоконтролируемого предварительного обучения, чтобы обеспечить более эффективную передачу знаний в нижестоящие федеративные модели. Обширные эмпирические результаты смоделированных и реальных объединенных наборов данных медицинских изображений показывают, что предварительное обучение с самоконтролем в значительной степени повышает устойчивость объединенных моделей к различной степени неоднородности данных. Примечательно, что в условиях сильной неоднородности данных наш метод, не полагаясь на какие-либо дополнительные данные перед обучением, обеспечивает улучшение точности теста на 5,06%, 1,53% и 4,58% в классификации сетчатки, дерматологии и рентгенографии грудной клетки по сравнению с контрольным исходным уровнем. с предварительным обучением ImageNet. Кроме того, мы показываем, что наш алгоритм FL с самоконтролем хорошо обобщает данные вне распределения и более эффективно изучает объединенные модели в сценариях с ограниченными метками, превосходя базовый уровень с учителем на 10,36% и метод FL с полуучителем на 8,3% в тесте. точность.
3. Маскированные сиамские сети для эффективного обучения с использованием меток (arXiv)
Автор: Махмуд Асран, Матильда Карон, Ишан Мишра, Петр Бояновский, Флориан Бордес, Паскаль Винсент, Арман Жулен, Майкл Раббат, Николя Баллас
Аннотация: мы предлагаем маскированные сиамские сети (MSN) — обучающую среду с самоконтролем для изучения представлений изображений. Наш подход сопоставляет представление изображения, содержащего случайно замаскированные участки, с представлением исходного изображения без маски. Эта стратегия предварительного обучения с самоконтролем особенно масштабируема при применении к трансформерам Vision, поскольку сеть обрабатывает только немаскированные патчи. В результате MSN улучшают масштабируемость архитектур совместного встраивания, создавая при этом представления высокого семантического уровня, которые конкурентоспособны при классификации изображений с малым числом выстрелов. Например, в ImageNet-1K, всего с 5000 аннотированных изображений, наша базовая модель MSN достигает точности 72,4 %, а с 1 % меток ImageNet-1K мы достигаем точности 75,7 %, устанавливая новое состояние: самого современного для обучения с самостоятельным наблюдением на этом тесте. Наш код общедоступен
4. GATE: Graph CCA для временного самостоятельного обучения для анализа фМРТ с эффективным использованием меток (arXiv)
Автор:Лян Пэн, Нань Ван, Цзе Сюй, Сяофэн Чжу, Сяосяо Ли
Аннотация: В этой работе мы фокусируемся на сложной задаче, классификации нервных заболеваний с использованием функциональной магнитно-резонансной томографии (фМРТ). В анализе заболеваний на основе популяционных графов графовые сверточные нейронные сети (GCN) достигли выдающихся успехов. Однако эти достижения неотделимы от обилия размеченных данных и чувствительны к ложным сигналам. Чтобы улучшить обучение представлению фМРТ и классификацию в условиях, эффективных с использованием меток, мы предлагаем новую и теоретическую основу обучения с самоконтролем (SSL) на GCN, а именно Graph CCA для временного обучения с самоконтролем на анализе фМРТ GATE. В частности, требуется разработать подходящую и эффективную стратегию SSL для извлечения формирования и надежных функций для фМРТ. С этой целью мы исследуем несколько новых стратегий увеличения графа из динамических функциональных связок (FC) fMRI для обучения SSL. Кроме того, мы используем канонический корреляционный анализ (CCA) для различных временных вложений и представляем теоретические выводы. Следовательно, это дает новую двухэтапную процедуру обучения GCN, состоящую из (i) SSL на немаркированном графе населения фМРТ и (ii) точной настройки небольшого помеченного набора данных фМРТ для задачи классификации. Наш метод протестирован на двух независимых наборах данных фМРТ, демонстрируя превосходную эффективность при диагностике аутизма и деменции.