Хорошо известно, что модели машинного обучения хорошо обнаруживают закономерности, принимают решения и принимают другие дискриминационные решения на основе ранее изученных обучающих данных.
Но новый тип модели машинного обучения (ML) используется для решения растущего числа вариантов использования. Мы говорим о генеративных моделях.
Генеративные модели отличаются от дискриминационных моделей, которые включают деревья решений, случайные леса и логистические регрессии. Как следует из названия, дискриминационные модели различают различные экземпляры данных и в большинстве случаев принимают относительно простое решение «да/нет» на основе этих данных.
Генеративные модели используют больше точек данных для создания новых чистых данных из того же набора обучающих данных.
Таким образом, вместо того, чтобы просто определять разницу между деревом и другим объектом, генеративные модели могут определять более сложные отношения. Сюда могут входить такие корреляции, как «деревья, скорее всего, будут появляться в сценах природы» или «деревья более десяти футов в высоту, а кусты меньше».
Хотя генеративные модели имеют множество многообещающих применений, у них есть и существенный недостаток: они представляют собой технологию, лежащую в основе так называемого дипфейк изображения и видеоконтента».
Но какое это имеет отношение к обнаружению опухолей головного мозга? Мы объясним ниже.
Типы генеративных моделей
Одним из первых типов генеративных моделей была генеративно-состязательная сеть (GAN). Разработанные в 2014 году исследователями из Университета Монреаля, GAN состоят из пары противоборствующих нейронных сетей — отсюда и словосочетание соперничество в названии — которые сражаются друг с другом во имя создания новых синтетических данных.
Сети GAN исключительно хорошо подходят для приложений с синтетическим голосом, видео или изображениями. Хотя GAN пережили заметный период бума и особенно хорошо подходят для множества приложений, они начали стабилизироваться. Во многом это связано с тем, что их часто трудно обучать, они склонны к сбою режима и часто страдают от недостатка разнообразия вывода.
Другие типы генеративных моделей включают вариационные автоэнкодеры (VAE), потоковые модели и авторегрессионные преобразователи. Последние, в частности, показали отличные результаты при обнаружении аномалий на медицинских изображениях, но имеют значительное время вывода и могут использоваться только с одномерными (1D) изображениями.
Но одним из самых захватывающих новых типов генеративных моделей являются диффузионные модели.
Что такое диффузионные модели?
Диффузионные модели происходят от вероятностных методов оценки правдоподобия. Вдохновленные физической диффузией молекул газа из областей с высокой плотностью в области с низкой плотностью — аналогично концепции тепловой смерти — модели диффузии собирают случайный шум из входных данных, постепенно удаляя этот шум, пока не появится связное изображение.
Лилиан Венг, исследователь OpenAI, добавляет, что модели диффузии определяют марковскую цепь шагов диффузии для добавления случайного шума к данным, а модели могут затем обратить этот процесс вспять для создания желаемой выборки данных.
Диффузионные модели — наряду с другими генеративными моделями, такими как VAE и модели последовательностей — начали использоваться исследователями ИИ IBM в своем наборе генеративных инструментов для научных открытий с открытым исходным кодом (GT4SD). Цель состоит в том, чтобы заняться такими приложениями, как разработка материалов и открытие, чтобы найти новые молекулы, лекарства и другие материалы.
Диффузионные модели доказали свою эффективность в полууправляемых, полностью контролируемых приложениях и приложениях обучения с подкреплением.
Как диффузионные модели помогают обнаруживать опухоли головного мозга?
Хотя диффузионные модели еще не используются в клинических условиях, несколько недавних исследований продемонстрировали их эффективность в облегчении неконтролируемого обнаружения аномалий головного мозга и устранении необходимости ручной маркировки медицинских изображений.
- Пиная и др. (2022): исследователи развернули диффузионные модели на двухмерных (2D) КТ и МРТ изображениях патологических поражений. Эксперименты показали, что диффузионные модели могут достигать конкурентоспособной производительности по сравнению с авторегрессионными моделями со значительно меньшим временем вывода. По словам исследователей, эксперименты доказали, что диффузионные модели клинически жизнеспособны.
- Воллеб и др. (2022): исследователи представили новый слабо контролируемый метод обнаружения аномалий, основанный на шумоподавляющих моделях диффузии и оцененный на наборе данных обнаружения опухолей головного мозга BRATS2020 и наборе данных CheXpert для плевральных выпотов. Авторы заявляют, что их метод «генерирует очень подробные карты аномалий без необходимости сложной процедуры обучения.
Отраслевые эксперты также считают диффузионные и другие генеративные модели ИИ отличными кандидатами для разработки промышленных и роботизированных продуктов, создания контента следующего поколения (например, невзаимозаменяемых токенов или NFT) и других диагностических приложений.
Свяжитесь с нами сегодня, чтобы получить техническую дискуссию с одним из экспертов CapeStart по машинному обучению о том, как генеративные модели искусственного интеллекта всех видов могут помочь масштабировать вашу медицинскую или научно-исследовательскую группу.