Значение p широко используется в статистическом анализе. Часто мы не понимаем более глубокого значения p-значения и можем неправильно его истолковать.

Проходя курс fast.ai, я узнал, что такое p-value, и как его интерпретировать. Ниже приведены мои выводы:

Трудно интерпретировать модели, которые нам подходят. Иногда мы наблюдаем связь между функциями и не уверены, случайны ли они или есть ли в них ценность. Итак, нам нужно понять отношения здесь. Это делается с помощью p-значения.

Курсы fast.ai ссылаются на статью, чтобы объяснить это. Бумага ниже о температуре и влажности, влияющих на передачу COVID-19:

Здесь статья завершается приведенным выше графиком, где говорится, что более высокая температура означает меньшее распространение COVID-19. Этот вывод был сделан путем определения p-value в разных городах. Это очень сильный вывод, так как он полагается исключительно на нулевую гипотезу, чтобы сделать вывод о p-значении городов.

Чтобы понять p-значение, вам нужно знать еще один термин «нулевая гипотеза».

Что такое нулевая гипотеза?

Нулевая гипотеза - это, по сути, исходное предположение. Это то, что мы думаем о взаимосвязи между двумя функциями.

Итак, мы берем эту нулевую гипотезу и собираем данные о независимых и зависимых переменных. Мы в основном проверяем те функции, которые, по нашему мнению, могут иметь некоторую зависимость. И мы видим, какой% времени мы видим этот тип отношений случайно. Это можно сделать, взглянув на исторические данные. Если мы не хотим идти по этому пути, мы тоже можем использовать уравнение. Уравнение p-значения можно использовать отсюда.

Чем больше p-значение, тем менее вероятно, что существует связь. Обратите внимание: здесь p-значение - это вероятность наблюдаемого результата при условии, что нулевая гипотеза верна. Вы можете видеть это на рисунке выше.

Таким образом, значение p принимается, если оно находится между наблюдаемой точкой данных и ближе к 0. Оно широко используется, чтобы понять, насколько хорошо работают модели и допущения.

Однако инструктор, конечно же, для fast.ai также говорит, что их не следует использовать всегда.

Ссылаясь на Американскую статистическую ассоциацию, есть несколько пунктов p-значений, которые нужно знать:

1. P-значения могут указывать на то, насколько данные несовместимы с указанной статистической моделью.

2. P-значения не измеряют вероятность того, что изучаемая гипотеза верна, или вероятность того, что данные были получены исключительно случайным образом.

3. Научные выводы и деловые или политические решения не должны основываться только на том, превышает ли p-значение определенный порог.

4. Правильный вывод требует полной отчетности и прозрачности.

5. p-значение или статистическая значимость не измеряют размер эффекта или важность результата.

6. Само по себе p-значение не обеспечивает хорошей оценки свидетельств в отношении модели или гипотезы.

Конечные баллы по значению p:

Если мы используем больше точек данных, наше p-значение может оказаться очень маленьким, поскольку оно может не отражать взаимосвязь. P-value также не отражает важность результатов, поскольку не коррелирует с объемом собранных данных.

Наконец, точное значение p-значения трудно понять, и, следовательно, его неправильное использование широко распространено. Следовательно, важно четко сформулировать нулевую гипотезу, если она используется в анализе.

Ссылка на курс fast.ai: https://course.fast.ai/