1 января 2022 г.
Матрица путаницы
Это метрика оценки классификации.
Матрица путаницы — это то место, где мы измеряем эффективность нашей модели. Лучше эффективность, лучше производительность, и это именно то, что мы хотим. И именно здесь в центре внимания оказывается матрица путаницы. Матрица путаницы — это показатель эффективности классификации машинного обучения.
Как следует из названия, это на самом деле немного сбивает с толку в первый раз, когда я учился, я имею в виду, что мне действительно требуется некоторое время, чтобы точно знать, когда что уменьшать и каковы эти положительные и отрицательные показатели. Матрица путаницы может применяться к задачам бинарной классификации, а также к задачам мультиклассовой классификации. В этом блоге мы увидим матрицу путаницы для двоичной классификации, потому что, если есть более 3 классов, я схожу с ума.
Чтобы оценить модели классификации, мы обсудим эти терминологии.
- Точность
- Точность
- Отзыв или чувствительность
- Специфика
- Ошибка
- F1-счет
- Кривая AUC-ROC
Что такое матрица путаницы?
- Матрица путаницы — это показатель оценки для классификации. Метрики оценки — это способ количественной оценки производительности модели машинного обучения.
- Матрица путаницы - это не что иное, как матрица 2 x 2, но с точки зрения проблемы двоичной классификации, где размер матрицы путаницы зависит от категорий / классов, которые у нас есть.
- В матрице путаницы наша цель состоит в том, чтобы уменьшить FP (частота ложных срабатываний), которая является ошибкой типа 1, и FN (ложноотрицательная ошибка), которая является ошибкой типа II.
- Это чрезвычайно полезно для измерения полноты, точности, специфичности, точности и, что наиболее важно, кривых AUC-ROC.
- Давайте разберемся с TP, FP, FN, TN с точки зрения аналогии с Covid.
Термины, связанные с матрицей путаницы:
– Истинный положительный результат (TP):
- Вы предсказывали положительный результат, и это правда.
- Вы предсказали, что у человека есть Covid, а на самом деле у этого человека есть. есть Ковид.
-True Negative (TN):
- Вы предсказали Негатив и его Истину.
- Вы предсказывали, что на человека не влияет Covid, и на самом деле этот человек на самом деле не затронут.
– Частота ложных срабатываний (FP): – Ошибка типа I:
- Вы предсказали Положительное и его Ложное.
- Вы предсказали, что у человека есть Covid, но на самом деле у этого человека Covid нет.
– Частота ложноотрицательных результатов (FN): – Ошибка типа II:
- Вы предсказали отрицательный результат и его ложь.
- Вы предсказали, что у человека нет Ковида, а на самом деле у него Ковид.
Точность:-
- Истинные положительные (TP) и истинно отрицательные (TN) блоки матрицы путаницы подпадают под точность.
- Точность никогда не следует использовать в качестве меры, когда целевые классы переменных в данных составляют большинство одного класса или класс является несбалансированным.
Точность:-
- Точность также называется положительными прогнозируемыми значениями.
- В Precision мы фактически фокусируемся на ложном срабатывании (FP).
- Он говорит, как часто моя модель была верна, когда предсказывала, что человек затронут.
Напомнить :-
- Отзыв также известен как чувствительность ИЛИ истинно положительная скорость.
- При воспоминании мы на самом деле фокусируемся на ложноотрицательном результате (FN).
- Это говорит о том, как часто моя модель предсказывала, что человек затронут, когда он действительно затронут.
Конкретность :-
- Это говорит о том, как часто моя модель предсказывала, что человек не затронут, когда на самом деле он не затронут.
Коэффициент ошибок = 1 – точность.
Оценка F1:-
- F1-Score в основном представляет собой среднее гармоническое (точность, отзыв). Иногда в некоторых постановках задачи важны как ложноположительные (fp), так и ложноотрицательные (fn), поэтому мы используем полноту и точность, чтобы найти F1-оценку.
- F-оценка помогает одновременно измерять полноту и точность.
Кривая AUC-ROC:-
- Когда нам нужно проверить или визуализировать производительность задачи классификации нескольких классов, мы используем кривую AUC (площадь под кривой) ROC (рабочие характеристики приемника).
- Кривая ROC — это широко используемый способ визуализации производительности бинарного классификатора, что означает классификатор с минимум двумя возможными выходными классами.
- Простыми словами, метрика AUC-ROC расскажет нам о способности модели различать классы. Чем выше AUC, тем лучше модель.
- Для построения кривой ROC AUC нам необходимо оптимизировать пороговые значения.
- Кривая ROC строится с отношением TPR (истинная положительная частота) к FPR (ложноположительная частота), где TPR находится на оси y, а FPR — на оси x.
- Говорят, что большая площадь под кривой — лучшая модель.
- Здесь красная линия считается очень плохой ROC-кривой, где AUC составляет где-то около 0,55, потому что она будет предсказывать 50–50 прогнозов того, что у человека рак или, возможно, нет рака.
- И хорошей моделью или лучшей моделью является Зеленая кривая, где точность составляет 100% (AUC составляет 1,0) и нет ошибочной классификации.
- Таким образом, мы получим лучший AUC, когда мы оптимизируем лучшее пороговое значение, уменьшая ложноположительные или ложноотрицательные значения в зависимости от варианта использования.
Когда следует уменьшать количество ложноположительных или отрицательных результатов в матрице путаницы:
- Пример 1. В случае рака
В случае рака мы должны сосредоточиться на отзыве, который является чувствительностью, где мы должны уменьшить ложноотрицательный результат (FN).
Предположим, если у человека рак, но модель предсказала, что у него нет рака, поэтому в этом сценарии мы должны уменьшить FN.
- Пример 2. Обнаружение нежелательной почты
В случае обнаружения спама мы должны сосредоточиться на точности (FP).
Предположим, что если письмо не является спамом, но модель предсказала, что это спам, то в этом сценарии мы должны уменьшить False Positive FP.
- Пример 3. Побочные эффекты вакцинации
Должен уменьшить FN: Если вакцина имеет побочные эффекты и прогнозируется отсутствие побочных эффектов, вакцинация может привести к другой проблеме со здоровьем.
Также мы должны уменьшить FP: ЕСЛИ вакцина не имеет побочных эффектов и прогнозируется, что она имеет побочный эффект, люди не будут готовы к вакцинации, и это приведет к еще более худшей ситуации.
Вы можете связаться со мной по адресу:
Инстаграм: https://www.instagram.com/godnooob/
Спасибо за прочтение!