Переход от PDF-файлов к дискретным значениям

Ранее я писал о Байесовском выводе в 1760 году, где я смотрел на распределения Бернулли и бета-версии.

Но вам не нужно использовать функцию плотности вероятности, теорема Байеса также работает с дискретными значениями. Давайте посмотрим на выявление болезней среди населения.

Возьмем заболевание, которое встречается у 1% населения, для которого у вас есть тест с точностью 99%:

True Positive (TP): 99% Correctly detects disease
False Positive (FP): 1% Incorrectly detects disease in healthy person
True Negative (TN): 99% Correctly detects absence of disease
False Negative (FN): 1% Incorrectly detects absence of disease in sick person

Случайный человек приходит в клинику и дает положительный результат - какова вероятность того, что этот человек действительно болен? Обдумайте ответ, прежде чем читать дальше.

Это можно решить численно без Байеса. Предположим, что произвольная численность населения составляет 10 000 человек. Из этих людей, как мы знаем, 1% населения страдает заболеванием:

100 people with the disease
9900 people without the disease

Далее мы можем подсчитать количество положительных тестов. 99% для группы болезней и 1% для здоровых:

100 * 99% = 99 True Positive
9900 * 1% = 99 False Positive

что дает нам ответ:

TP / (TP + FP) = 99 / (99 + 99) = 50%

Случайный человек с положительным результатом теста имеет только 50% шанс заболеть, если у 1% населения есть болезнь, а ваш тест точен на 99%! Вы все еще помните угаданный номер? Правдивый ответ в 50% является неожиданностью для большинства людей.

Теперь снова используя теорему Байеса:

P(A ∣ B) = P(B ∣ A) P(A)
          ───────────────
                P(B)
A = Disease
B = Positive test

Снова вопрос: какова вероятность заболевания при положительном тесте, что такое P (A ∣ B)?

Вероятность положительного результата теста при заболевании:

P(B ∣ A) = 0.99

Вероятность заболевания:

P(A) = 0.01

Вероятность положительного теста:

P(B) = 0.99 × 0.01 + 0.01 × 0.99 = 2 × 0.99 × 0.01

Завершите расчет:

P(A ∣ B) = P(B ∣ A) × P(A)
          ───────────────
                P(B) 
         =   0.99 × 0.01
           ───────────────
           2 × 0.99 × 0.01
         = 1/2
         = 50%

Тест с точностью 99%, но случайный пациент с положительным результатом теста имеет только 50–50 шансов действительно заболеть заболеванием! Заболеваемость среди населения - критическая переменная, которую многие люди упускают из виду.

Посмотрите, как они ошибаются в новостях: 81%« подозреваемых , признанных полицией Метрополитен невиновными, говорится в независимом отчете»

См. Также: Байесовская система ранжирования