- Наблюдение за Землей от сцены к участку: обучение множеству экземпляров для классификации земного покрова(arXiv)
Автор: Джозеф Ранний, Йинг-Юнг Дьюис, Кристин Эверс, Сарвапали Рамчурн.
Аннотация:Классификация земного покрова (LCC) и мониторинг изменений землепользования с течением времени — важный процесс смягчения последствий изменения климата и адаптации к нему. Существующие подходы, которые используют машинное обучение с данными наблюдения Земли для LCC, полагаются на полностью аннотированные и сегментированные наборы данных. Создание этих наборов данных требует больших усилий, а отсутствие подходящих наборов данных стало препятствием для масштабирования использования LCC. В этом исследовании мы предлагаем модели Scene-to-Patch: альтернативный подход LCC, использующий множественное обучение (MIL), для которого требуются только высокоуровневые метки сцен. Это позволяет гораздо быстрее разрабатывать новые наборы данных, обеспечивая при этом сегментацию с помощью прогнозов на уровне исправлений, что в конечном итоге повышает доступность использования LCC для различных сценариев. В наборе данных DeepGlobe-LCC наш подход превосходит базовые показатели без MIL как при прогнозировании на уровне сцены, так и на уровне патча. Эта работа обеспечивает основу для расширения использования LCC в методах смягчения последствий изменения климата для технологий, правительства и научных кругов.
2. MixUp-MIL: новое расширение данных для обучения множеству экземпляров и исследование диагностики рака щитовидной железы(arXiv)
Автор: Майкл Гадермайр, Лукас Коллер, Максимилиан Чухниг, Леа Мария Стангассингер, Кристина Кройцер, Себастьян Куйяр-Депре, Герти Яннеке Остинг, Антон Хиттмайр
Аннотация :обучение с несколькими экземплярами демонстрирует мощный подход к диагностике на основе изображения всего слайда при отсутствии аннотаций на уровне пикселей или фрагментов. Несмотря на огромный размер изображений слайдов с отверстиями, количество отдельных слайдов часто довольно мало, что приводит к небольшому количеству помеченных образцов. Чтобы улучшить обучение, мы предлагаем и исследуем различные стратегии увеличения данных для обучения с несколькими экземплярами, основанные на идее линейной интерполяции векторов признаков (известной как MixUp). На основе современных архитектур обучения с несколькими экземплярами и двух наборов данных о раке щитовидной железы проводится исчерпывающее исследование с учетом ряда общих стратегий увеличения данных. В то время как стратегия, основанная на оригинальном подходе MixUp, показала снижение точности, использование нового метода интерполяции внутри предметного стекла привело к последовательному повышению точности.
3. Эквивариантная регуляризация с самоконтролем согласовывает обучение на нескольких экземплярах: совместная классификация диабетической ретинопатии и сегментация поражений(arXiv)
Автор:Вэньхуэй Чжу, Пэйцзе Цю, Наташа Лепоре, Оана М. Думитраску, Ялин Ван
Аннотация:Внешний вид поражения является важным признаком для медицинских работников, позволяющим отличить референтную диабетическую ретинопатию (рДР) от нереференциальной ДР. Большинство существующих крупномасштабных наборов данных DR содержат только метки на уровне изображения, а не аннотации на основе пикселей. Это побуждает нас разрабатывать алгоритмы для классификации rDR и сегментации поражений с помощью меток на уровне изображения. В этой статье для решения этой проблемы используется эквивариантное обучение с самоконтролем и многоэкземплярное обучение на основе внимания (MIL). MIL — это эффективная стратегия для дифференциации положительных и отрицательных случаев, помогающая нам отбрасывать фоновые области (отрицательные случаи) и локализовать области поражения (положительные). Однако MIL обеспечивает только грубую локализацию поражения и не может различить поражения, расположенные на соседних участках. И наоборот, самоконтролируемый механизм эквивариантного внимания (SEAM) генерирует карту активации класса на уровне сегментации (CAM), которая может более точно направлять извлечение очагов поражения. Наша работа направлена на интеграцию обоих методов для повышения точности классификации rDR. Мы проводим обширные проверочные эксперименты на наборе данных Eyepacs, достигая области под кривой рабочей характеристики приемника (AU ROC) 0,958, что превосходит текущие современные алгоритмы.