Введение в ROC AUC

ROC AUC, или рабочая характеристика приемника — площадь под кривой, — это показатель, обычно используемый для оценки эффективности моделей бинарной классификации. Он измеряет способность модели различать положительные и отрицательные классы и особенно полезны в случаях, когда классы несбалансированы. Кривая ROC представляет собой график отношения истинно положительных результатов (TPR) к уровню ложноположительных результатов (FPR) при различных пороговых значениях классификации, а AUC представляет собой площадь под этой кривой. Значения AUC варьируются от 0 до 1, причем более высокие значения указывают на лучшую производительность модели. В этом сообщении блога мы обсудим определение и важность ROC AUC, а также то, как он рассчитывается и используется при оценке моделей машинного обучения. Таким образом, это очень важный показатель для оценки производительности модели машинного обучения.

Как рассчитывается ROC AUC

Чтобы понять, как рассчитывается ROC AUC, важно сначала понять концепции истинно положительного показателя (TPR) и ложноположительного показателя (FPR). TPR, также известный как чувствительность или отзыв, представляет собой долю фактических положительных случаев, которые правильно предсказаны моделью. FPR, также известный как выпадение, представляет собой долю отрицательных случаев, которые ошибочно прогнозируются как положительные. Эти ставки можно рассчитать по следующим формулам:

TPR = истинные положительные результаты / (истинные положительные результаты + ложноотрицательные результаты)

FPR = ложные срабатывания / (ложные срабатывания + истинные отрицательные значения)

Для построения ROC-кривой рассчитываются TPR и FPR для разных порогов классификации, а полученные точки наносятся на график. Порог классификации — это вероятность, при которой случай классифицируется как положительный или отрицательный. Например, если порог установлен на 0,5, любой случай с прогнозируемой вероятностью выше 0,5 будет классифицироваться как положительный, а любой случай с прогнозируемой вероятностью менее 0,5 будет классифицирован как отрицательный. Изменяя порог, мы можем видеть, как меняется производительность модели по мере смещения баланса между истинными и ложными прогнозами.

После построения кривой ROC можно рассчитать AUC, определив площадь под кривой. Значения AUC варьируются от 0 до 1, причем более высокие значения указывают на лучшую производительность модели. Модель с AUC 1 имеет идеальное различение, а модель с AUC 0,5 не имеет возможности различения. Сравнивая значения AUC разных моделей, мы можем определить, какая модель имеет наилучшую общую производительность.

Преимущества и недостатки ROC AUC

ROC AUC — широко используемый и хорошо зарекомендовавший себя показатель для оценки эффективности моделей бинарной классификации.

Некоторые преимущества использования ROC AUC включают:

Широкое использование. ROC AUC — это общепринятая и понятная метрика, которая обычно используется в области машинного обучения в качестве эталона производительности модели.

Двоичная и мультиклассовая классификация. ROC AUC можно использовать для оценки производительности моделей как для бинарных, так и для многоклассовых задач классификации.

Простота расчета. Существуют различные инструменты и библиотеки для расчета ROC AUC, что упрощает включение в процессы оценки моделей.

Однако у ROC AUC есть некоторые ограничения и недостатки, которые следует учитывать.

Одним из основных недостатков является то, что он чувствителен к дисбалансу классов, а это означает, что он может не подходить для наборов данных с сильно дисбалансными классами. В этих случаях могут оказаться более подходящими другие показатели оценки, такие как точность и полнота. При выборе метрики оценки важно тщательно учитывать характеристики набора данных и цели модели.

Примеры использования ROC AUC

Чтобы продемонстрировать использование ROC AUC, давайте рассмотрим простой набор данных бинарной классификации со следующей матрицей путаницы:

              Actual Positive    Actual Negative
Predicted Positive        100                50
Predicted Negative         50               200

Используя формулы для TPR и FPR, мы можем рассчитать ставки для различных порогов классификации следующим образом:

Threshold     TPR    FPR
  0.9        1.00    0.71
  0.8        0.94    0.43
  0.7        0.88    0.25
  0.6        0.82    0.14
  0.5        0.76    0.08
  0.4        0.71    0.04
  0.3        0.65    0.02
  0.2        0.59    0.01
  0.1        0.53    0.00
  0.0        0.47    0.00

Затем мы можем построить TPR против FPR для каждого порога, чтобы создать кривую ROC.

Наконец, мы можем рассчитать AUC, определив площадь под кривой. В этом случае AUC составляет 0,854, что указывает на хорошую дискриминационную способность модели.

Мы также можем сравнить ROC AUC между разными моделями, рассчитав AUC для каждой модели и сравнив результаты. Например, если у нас есть две модели, обученные на одном и том же наборе данных, модель A с AUC 0,8 и модель B с AUC 0,9, мы можем сделать вывод, что модель B имеет лучшую общую производительность, чем модель A.

Важно отметить, что ROC AUC не должна быть единственной метрикой, используемой для оценки модели, и всегда рекомендуется рассматривать различные оценочные метрики в зависимости от конкретных целей модели и характеристик набора данных.

Заключение

В этом сообщении блога мы обсудили определение и важность ROC AUC как метрики для оценки производительности моделей бинарной классификации. Мы рассмотрели этапы расчета TPR, FPR и AUC, а также то, как построить кривую ROC и интерпретировать результаты. Мы также обсудили преимущества и недостатки использования ROC AUC, в том числе его широкое использование и способность решать задачи бинарной и мультиклассовой классификации, а также его чувствительность к дисбалансу классов.

Как и в случае с любой оценочной метрикой, при использовании ROC AUC важно учитывать ограничения и потенциальные проблемы. Одним из основных ограничений является то, что он может не подходить для сильно несбалансированных наборов данных. Кроме того, ROC AUC не должна быть единственной метрикой, используемой для оценки модели, и всегда рекомендуется рассматривать различные оценочные метрики в зависимости от конкретных целей модели и характеристик набора данных.

В целом, ROC AUC является полезной и широко используемой метрикой для оценки производительности моделей бинарной классификации и может дать ценную информацию о способности модели различать положительные и отрицательные классы.

Удачного обучения!!!

⊂◉‿◉つ

Для практической реализации посетите мой репозиторий Github.

Об авторе: я Амбариш, энтузиаст науки о данных. В настоящее время я изучаю машинное обучение/глубокое обучение/НЛП/компьютерное зрение, и если у вас есть какие-либо вопросы, свяжитесь со мной в моем профиле Linkedin.