Соавтор: Приянш Сони
Подробный обзор разработки комплексной ансамблевой модели для раннего выявления диабетической язвы стопы (DFU)
Это относится к исследованию, в котором я был соавтором, по раннему выявлению DFU для предотвращения больших ампутаций и отсутствия клинической осмотрительности.
СХЕМА –
- Введение
- Постановка проблемы и подход
- Сбор данных и предварительная обработка
- Некоторые предварительно обученные архитектуры
- Производительность модели
- Техника составного ансамбля
- Заключение
Диабет — это медицинское заболевание, которое растет быстрее, чем когда-либо, с увеличением численности населения и уровня стресса. Диабет – одно из самых смертоносных заболеваний нынешнего поколения, которым страдает более 537 миллионов человек во всем мире.
Плюс очень высок процент ампутаций, когда речь идет об отсутствии искренности в раннем выявлении болезни. Таким образом, нельзя полагаться исключительно на клинические показатели, поскольку им не хватает времени, высокой стоимости диагностики и многого другого.
И вот тут в игру вступает Глубокое обучение.
- Постановка задачи. Имея изображения здоровой стопы и изображения стопы, инфицированной ДФУ, как мы можем разработать метод для классификации изображений ДФУ и здоровой стопы.
- Подход. Мы можем передавать изображения в сверточную нейронную сеть (CNN) с некоторыми слоями пула и еще чем-то и можем генерировать функции из этих изображений, которые затем могут быть загружены в некоторый уровень softmax для классификации.
Такой подход представляется жизнеспособным. Такой классификатор может помочь нам классифицировать образцы изображений на DFU и здоровых, возможно, на какой-либо другой тип заболевания. Это может помочь нам найти эффективное решение, намного лучшее, чем ручное клиническое наблюдение за каждым пациентом, для выявления ДФУ или другого типа заболевания.
Но нам нужны данные.
Сбор данных
Данные, доступные в Интернете для работы с образцами изображений DFU, являются частными и могут быть доступны только через университеты и частные медицинские учреждения. Один из очень немногих наборов данных изображений DFU с открытым исходным кодом можно найти на Kaggle здесь.
Одним из самых популярных наборов данных в DFU является набор данных DFUC.
The Diabetic Foot Ulcers Grand Challenge (DFUC) — это соревнование по классификации медицинских изображений, организованное организацией Medical Image Computing and Computer-Assisted Intervention (MICCAI). Набор данных содержит около 4000 DFU и изображений здоровой стопы, разделенных на обучающие и тестовые наборы.
Набор данных DFUC общедоступен только для некоммерческих исследовательских целей, и его можно получить, отправив официальный запрос по электронной почте [email protected].
Предварительная обработка данных
Если мы ограничены меньшим количеством данных, мы можем выполнить дополнение данных, чтобы предотвратить переоснащение модели и создать больше данных для обучения модели.
После сбора и предварительной обработки данных мы, наконец, можем перейти к обучению обработанных данных на некоторых классификаторах, чтобы делать прогнозы.
Трансферное обучение позволяет обучать архитектуры глубокого обучения на миллиардах изображений данных, переданных в качестве входных данных ранее, а затем использовать предварительно обученные модели для нашей собственной постановки задачи. Это помогает модели более эффективно изучать низкоуровневые функции с использованием большого количества данных. Мы можем использовать предварительно обученные функции модели для нашего собственного набора данных, формируя более глубокие слои модели в соответствии с нашим удобством и набором данных.
Благодаря этому великолепию Deep Learning мы можем использовать некоторые из наиболее популярных предварительно обученных моделей Deep CNN, доступных здесь. Это :
Обучение наших данных на этих моделях может дать отличные результаты.
Результаты, полученные с помощью этих предварительно обученных архитектур, могут быть основаны на следующих показателях оценки:
Эти показатели помогают нам оценить, насколько хорошо работает наша модель в зависимости от типа проблемы. Для медицинских проблем запоминание имеет большое значение по сравнению с другими показателями оценки. Это связано с тем, что мы хотим максимально снизить количество ложноотрицательных результатов при выявлении любого заболевания, и поэтому мы отдаем приоритет увеличению отзыва со сбалансированным компромиссом для точности.
Но можем ли мы добиться большего успеха, чем одна предварительно обученная модель?
- Моделирование с накоплением — метод наложения выходных данных одной модели на выходные данные другой для создания скомпилированной выходной матрицы. Затем эту матрицу можно передать в некоторый классификатор для прогнозирования. Это полезно, поскольку он использует функции, созданные из обеих моделей, а затем передает эти объединенные функции в другую модель (классификатор).
Для получения более подробной информации о многоуровневом моделировании вы можете посетить this. - Моделирование ансамбля — метод объединения нескольких слабых обучаемых (моделей) для получения единого результата. Этот результат, как правило, лучше, чем у отдельных слабых учеников.
Для получения более подробной информации об обучении в ансамбле вы можете посетить this.
Модельный подход —
- Выберите 2 модели из предварительно обученных архитектур с высокой точностью и меньшим размером модели.
- Обучите эти две DCNN с помощью нашего набора данных DFU.
- Вместо того, чтобы применять слой Softmax в качестве последнего слоя, мы складываем результаты этих двух моделей в единую матрицу признаков (скажем, M).
- Эта матрица функций M имеет функции, обученные из двух наиболее эффективных и эффективных предварительно обученных моделей размера в нашем наборе данных DFU.
- Отправьте эту матрицу признаков M в качестве входных данных в классификатор машинного обучения. Наилучших результатов можно добиться, используя для классификации XGBoost Classifier.
Эта модель превосходит предварительно обученные архитектуры из-за использования стека выходных признаков, который делает матрицу признаков очень плотной и, следовательно, дает лучшие результаты.
Двухуровневую архитектуру предлагаемой модели можно визуализировать ниже:
Архитектура уровня 1
Архитектура уровня 2
Объединяя функции двух предварительно обученных моделей и вводя их в качестве входных данных для отдельного классификатора, мы можем получить лучшие результаты для обнаружения классификации изображений DFU.
Предлагаемая нами модель может классифицировать изображения DFU из изображений здоровой кожи с высокой точностью и полнотой.
Исследование было принято на 4-й конференции IEEE ICAC3N-22, проходившей 14–15 декабря 2022 г.
Первоначально опубликовано на https://medium.com 18 мая 2022 г.