Переход от PDF-файлов к дискретным значениям
Ранее я писал о Байесовском выводе в 1760 году, где я смотрел на распределения Бернулли и бета-версии.
Но вам не нужно использовать функцию плотности вероятности, теорема Байеса также работает с дискретными значениями. Давайте посмотрим на выявление болезней среди населения.
Возьмем заболевание, которое встречается у 1% населения, для которого у вас есть тест с точностью 99%:
True Positive (TP): 99% Correctly detects disease False Positive (FP): 1% Incorrectly detects disease in healthy person True Negative (TN): 99% Correctly detects absence of disease False Negative (FN): 1% Incorrectly detects absence of disease in sick person
Случайный человек приходит в клинику и дает положительный результат - какова вероятность того, что этот человек действительно болен? Обдумайте ответ, прежде чем читать дальше.
Это можно решить численно без Байеса. Предположим, что произвольная численность населения составляет 10 000 человек. Из этих людей, как мы знаем, 1% населения страдает заболеванием:
100 people with the disease 9900 people without the disease
Далее мы можем подсчитать количество положительных тестов. 99% для группы болезней и 1% для здоровых:
100 * 99% = 99 True Positive 9900 * 1% = 99 False Positive
что дает нам ответ:
TP / (TP + FP) = 99 / (99 + 99) = 50%
Случайный человек с положительным результатом теста имеет только 50% шанс заболеть, если у 1% населения есть болезнь, а ваш тест точен на 99%! Вы все еще помните угаданный номер? Правдивый ответ в 50% является неожиданностью для большинства людей.
Теперь снова используя теорему Байеса:
P(A ∣ B) = P(B ∣ A) P(A) ─────────────── P(B) A = Disease B = Positive test
Снова вопрос: какова вероятность заболевания при положительном тесте, что такое P (A ∣ B)?
Вероятность положительного результата теста при заболевании:
P(B ∣ A) = 0.99
Вероятность заболевания:
P(A) = 0.01
Вероятность положительного теста:
P(B) = 0.99 × 0.01 + 0.01 × 0.99 = 2 × 0.99 × 0.01
Завершите расчет:
P(A ∣ B) = P(B ∣ A) × P(A) ─────────────── P(B) = 0.99 × 0.01 ─────────────── 2 × 0.99 × 0.01 = 1/2 = 50%
Тест с точностью 99%, но случайный пациент с положительным результатом теста имеет только 50–50 шансов действительно заболеть заболеванием! Заболеваемость среди населения - критическая переменная, которую многие люди упускают из виду.
Посмотрите, как они ошибаются в новостях: 81%« подозреваемых , признанных полицией Метрополитен невиновными, говорится в независимом отчете»
См. Также: Байесовская система ранжирования