В этом блоге я попытаюсь объяснить все основные термины матрицы путаницы и способы их вычисления на примере.

Мы используем матрицу неточностей для оценки эффективности модели классификации. В этом примере мы используем классификатор, чтобы предсказать, собака это или кошка. Моя главная цель - помочь вам понять интуицию, лежащую в основе терминологии.

ИСТИННЫЙ ПОЛОЖИТЕЛЬНЫЙ (TP): Прогноз - это собака, а на самом деле собака.

ИСТИННЫЙ ОТРИЦАТЕЛЬНЫЙ (TN): предсказание - это кошка, а на самом деле кошка.

ЛОЖНО ПОЛОЖИТЕЛЬНО (FP): Прогноз - это собака, а на самом деле кошка. Также известен как «ОШИБКА ТИПА I».

ЛОЖНО ОТРИЦАТЕЛЬНО (FN): предсказание - это кошка, а на самом деле собака. Также известна как «ОШИБКА ТИПА II».

ИСТИННАЯ ПОЛОЖИТЕЛЬНАЯ СТАВКА (TPR) / ОБЗОР / ЧУВСТВИТЕЛЬНОСТЬ / СТАВКА

Когда это на самом деле собака, сколько раз наш классификатор предсказывает это как собаку. Рейтинг правильно предсказывающих собак.

ИСТИННАЯ ОТРИЦАТЕЛЬНАЯ СТАВКА (TNR) / СПЕЦИФИЧНОСТЬ / ВЫБОРКА

Когда это на самом деле кошка, сколько раз наш классификатор предсказывает это как кошку. Курс правильно предсказывающих кошек.

ЛОЖНО ПОЛОЖИТЕЛЬНАЯ СТАВКА (FPR) / ВЫПАДЕНИЕ

Когда это на самом деле кошка, сколько раз наш классификатор предсказывает это как собаку.

ЛОЖНО ОТРИЦАТЕЛЬНАЯ СТАВКА (FNR) / MISS RATE

Когда это на самом деле собака, сколько раз наш классификатор предсказывает это как кошку.

ПОЛОЖИТЕЛЬНАЯ ПРОГНОЗНАЯ СТОИМОСТЬ (PPV) / ТОЧНОСТЬ

Когда наш классификатор предсказывает собаку, сколько раз он верен?

ОТРИЦАТЕЛЬНАЯ ПРОГНОЗНАЯ СТОИМОСТЬ (ЧПС)

Когда наш классификатор предсказывает кошку, сколько раз он верен?

ТОЧНОСТЬ

Как часто наш классификатор предсказывает правильно?

СРОК НЕКЛАССИФИКАЦИИ / СТАВКА ОШИБОК

Как часто наш классификатор предсказывает неверно?

F1-ОЦЕНКА

Мы не можем сравнивать точность и отзыв вместе, поэтому для сравнения мы берем средневзвешенное значение точности и отзыва.

F1-Score - это гармоническое среднее значение точности и полноты и имеет решающее значение, когда ложноотрицательные и ложноположительные значения важны в нашем классификаторе, он также показывает лучший показатель в случае классов дисбаланса.

РАСПРОСТРАНЕНИЕ

Как часто собака на самом деле встречается в нашей выборке?

Надеюсь, вы получили общее представление о том, что такое матрица путаницы. Если этот пост помог вам, пожалуйста, подумайте о том, чтобы дать мне мотивацию.