Проблема с вычислением ошибок по семействам

Предположим, у меня есть набор данных с 12 переменными, и он содержит около 100 случаев. Если я собираюсь провести t-тест между двумя переменными, затем выполнить дисперсионный анализ между 3 другими переменными, а затем постфактум. и, возможно, после этого Манн-Уитни для непараметрической переменной... мой вопрос заключается в том, если я собираюсь использовать Бонферрони для апостериорного анализа в дисперсионном анализе, как я должен рассчитать семейную ошибку? когда начинается семейство анализов? когда это закончится?


person Hasan Jamil    schedule 26.04.2020    source источник


Ответы (2)


Как следует из названия, FWER — это вероятность сделать одно или несколько ложных открытий при проверке нескольких гипотез.

Если вы попробуете два разных теста для одной и той же гипотезы, это будет одна и та же гипотеза, поэтому вы не сделаете FWER.

В постфактум вы повторяете тест на различия между переменными, и вы можете применить там Бонферрони.

person StupidWolf    schedule 09.05.2020
comment
Я думаю, что я собираюсь получить. Можете ли вы привести пример? - person Hasan Jamil; 11.05.2020

Если я собираюсь провести t-тест между двумя переменными, а затем выполнить дисперсионный анализ между тремя другими переменными, то апостериорный анализ может ввести в заблуждение.

Если вы говорите об однофакторном дисперсионном анализе, то вы можете сделать это только для 2 переменных: 1 числовая/метрическая переменная отклика (исследователи обычно называют ее «зависимой переменной») и 1 категориальная переменная. /неметрическая предикторная переменная (исследователи обычно называют ее «независимой переменной») с двумя или более категориями.

Если нулевая гипотеза (среднее значение для всех групп/категорий одинаковое) дисперсионного анализа отвергается, это означает, что по крайней мере одна группа/категория имеет значительно отличающееся среднее значение.

Для дальнейшего анализа того, какие из групп имеют статистически значимо разные средние значения, вам необходимо попарное сравнение. Для этого вы можете использовать апостериорные тесты.

Апостериорные тесты состоят из попарных сравнений, предназначенных для сравнения среднего значения всех различных комбинаций групп. Таким образом, это похоже на то, как взять каждую пару групп, а затем выполнить t-тест для каждой пары групп.

Есть несколько способов скорректировать семейные ошибки. Бонферрони предлагает простой способ деления p-значения на количество тестов, известный как поправка Бонферрони для p-значения. Однако эта корректировка очень консервативна. Чтобы уменьшить количество ложных открытий, это увеличивает вероятность ложных отрицательных результатов. Есть и другие апостериорные тесты, такие как LSD, Tuckey, SNK, Q-процесс Уэлча, процесс Данна и Шеффе и т. д.

Теперь перейдем к вашему вопросу: как мне рассчитать семейную ошибку? когда начинается семейство анализов? когда это закончится?

Представьте, что вы выполняете отдельные t-тесты для каждой пары групп. Вам нужно будет провести три сравнения между средними значениями (переменной отклика) групп A и B, A и C и B и C, предполагая, что ваш предиктор/независимая переменная имеет три группы A, B и C.

Если каждый из этих t-тестов использует уровень значимости 0,05, то для каждого теста вероятность ложного отклонения нулевой гипотезы (известная как ошибка типа I) составляет всего 5%. Следовательно, вероятность отсутствия ошибок типа I составляет 0,95 (95%) для каждого теста.

Если мы предположим, что каждый тест является независимым (следовательно, мы можем перемножить вероятности), то общая вероятность отсутствия ошибок типа I составит (0,95)3 = 0,95 × 0,95 × 0,95 = 0,857, поскольку вероятность отсутствия Ошибки типа I составляют 0,95 для каждого теста, всего три теста.

Учитывая, что вероятность отсутствия ошибок типа I равна 0,857, мы можем рассчитать вероятность совершения хотя бы одной ошибки типа I, вычитая это число из 1 (помните, что максимальная вероятность любого события равна 1). Таким образом, вероятность хотя бы одной ошибки первого рода составляет 1 − 0,857 = 0,143, или 14,3%.

Таким образом, в этой группе тестов вероятность совершения ошибки типа I увеличилась с 5 % до 14,3 %. Этот уровень ошибок в статистических тестах, проведенных на одних и тех же экспериментальных данных, известен как семейный или экспериментальный. сильный> частота ошибок.

Узнайте больше о выборе подходящего теста, предположениях и интерпретации, множественных тестах, апостериорных тестах и ​​контрастах. Какой бы инструмент (SPSS/SAS/R) вы ни использовали, концепция остается неизменной. Вы можете обратиться к статье «Обнаружение статистики с использованием IBM SPSS» или «Обнаружение статистики с использованием R» Энди Филда для получения более подробной информации.

person Dr Nisha Arora    schedule 19.05.2021