- Дизайн гибридного ансамбля для выбора биомаркеров-кандидатов из профилей транскриптома (arXiv)
Автор: Фелипе Коломбелли, Тейн Войсинк Ковальски, Мариана Рекамонде-Мендоса.
Резюме: Открытие биомаркеров заболеваний на основе данных об экспрессии генов значительно продвинулось с помощью методов отбора признаков (FS), особенно с использованием стратегий ансамблевой FS (EFS) с возмущением на уровне данных (т. е. гомогенный, Hom-EFS) или на уровне метода ( то есть гетерогенный, Het-EFS). Здесь мы предложили дизайн Hybrid EFS (Hyb-EFS), который исследует оба типа возмущений для улучшения стабильности и прогностической способности биомаркеров-кандидатов. При этом Hyb-EFS стремится разрушить ассоциации хорошей производительности с одним набором данных, одним алгоритмом или конкретной комбинацией того и другого, что особенно интересно для лучшей воспроизводимости геномных биомаркеров. Мы исследовали адекватность нашего подхода для данных микрочипов, относящихся к четырем типам рака, проведя обширное сравнение с другими подходами ансамбля и одиночной FS. В наших экспериментах использовались пять методов FS: Wx, симметричная неопределенность (SU), коэффициент усиления (GR), характеристическое направление (GeoDE) и рельеф F. Мы заметили, что подходы Hyb-EFS и Het-EFS ослабили большие различия в производительности, наблюдаемые для большинства одиночных FS и Hom-EFS в разных наборах данных. Кроме того, Hyb-EFS улучшил стабильность Het-EFS в нашем домене. Сравнивая Hyb-EFS и Het-EFS, состоящие из наиболее эффективных селекторов (Wx, GR и SU), наш гибридный подход превзошел эквивалентный гетерогенный дизайн и лучший Hom-EFS (Hom-Wx). Интересно, что рейтинги, полученные с помощью Hyb-EFS, достигли большей биологической правдоподобности с заметно высоким обогащением генов и путей, связанных с раком. Таким образом, наши эксперименты предполагают потенциал предлагаемого дизайна Hybrid EFS в обнаружении биомаркеров-кандидатов из данных микрочипов. Наконец, мы предоставляем платформу с открытым исходным кодом для поддержки аналогичного анализа в других областях, как в виде удобного приложения, так и в виде простого пакета Python.
2. Глубокое ортогональное слияние: открытие мультимодальных прогностических биомаркеров, объединяющих радиологические, патологические, геномные и клинические данные (arXiv)
Автор: Натаниэль Браман, Джейкоб В. Х. Гордон, Эмери Т. Гуссенс, Калеб Уиллис, Мартин С. Стамп, Джагадиш Венкатараман.
Резюме: Принятие клинических решений в онкологии включает мультимодальные данные, такие как радиологические снимки, молекулярное профилирование, гистопатологические слайды и клинические факторы. Несмотря на важность этих модальностей по отдельности, на сегодняшний день ни одна структура глубокого обучения не объединила их все для прогнозирования прогноза пациента. Здесь мы прогнозируем общую выживаемость (ОВ) пациентов с глиомой на основе разнообразных мультимодальных данных с помощью модели Deep Orthogonal Fusion (DOF). Модель учится объединять информацию из многопараметрических МРТ-исследований, методов биопсии (например, изображений слайдов H&E и/или секвенирования ДНК) и клинических переменных в комплексную мультимодальную оценку риска. Прогностические вложения из каждой модальности изучаются и комбинируются посредством слияния тензоров с контролем внимания. Чтобы максимизировать информацию, полученную от каждой модальности, мы вводим термин потерь мультимодальной ортогонализации (MMO), который повышает производительность модели, стимулируя составляющие вложения, чтобы они были более взаимодополняющими. DOF предсказывает ОВ у пациентов с глиомой со средним C-индексом 0,788 +/- 0,067, что значительно превосходит (p = 0,023) лучшую одномодальную модель со средним C-индексом 0,718 +/- 0,064. Прогностическая модель значительно стратифицирует пациентов с глиомой по ОС в пределах клинических подмножеств, добавляя дополнительную детализацию к прогностической клинической классификации и молекулярному подтипу.