два выборочных t-теста в R: направление сравнения?

Допустим, у меня есть данные о емкости легких курильщиков и некурящих. Итак, у нас есть переменная «lungCap» с числовым значением и переменная «курение» со значениями «да» или «нет». Теперь я хочу посмотреть, больше ли вместимость некурящих, чем у курящих:

t.test(lungCap~smoking, alt="greater")

Вычисляет ли теперь тест, если "да" > "нет" или "нет" > "да"? Как это определяется? Я не смог найти его в справке по команде t.test.


person E_H    schedule 15.04.2018    source источник
comment
В документации: альтернатива = больше - это альтернатива, что x имеет большее среднее значение, чем y.   -  person phiver    schedule 15.04.2018
comment
@phiver - правда, но в документации прямо не указано, как t.test() распределяет значения независимой переменной как x по сравнению с y, поэтому не очевидно, какой из них будет напечатан в левом столбце вывода (сторона x) по сравнению с правым столбцом ( сторону у).   -  person Len Greski    schedule 15.04.2018


Ответы (1)


При использовании независимой переменной на основе символов t.test() будет сравниваться на основе алфавитного порядка значений в независимой переменной.

Чтобы проиллюстрировать это, мы сравним мили на галлон в автомобилях с механической и автоматической коробками передач, используя набор данных автомобилей Motor Trend 1973 года.

Мы создадим символьную переменную для представления автоматического и ручного (чтобы проиллюстрировать сценарий в OP) и запустим t-тест.

Мы проверим следующие гипотезы:

  • H_null: мили на галлон автомобилей с механической коробкой передач ‹= мили на галлон автомобилей с автоматической коробкой передач
  • H_alt: расход автомобилей с механической коробкой передач больше, чем расход автомобилей с автоматической коробкой передач.

Чтобы запустить тест, мы загрузим данные, создадим дополнительный столбец и выполним t.test().

data(mtcars)
mtcars$trans <- ifelse(mtcars$am == 1,"manual","automatic")

t.test(mtcars$mpg ~ mtcars$trans,alt="greater")

... и вывод:

> t.test(mtcars$mpg ~ mtcars$trans,alt="greater")

    Welch Two Sample t-test

data:  mtcars$mpg by mtcars$trans
t = -3.7671, df = 18.332, p-value = 0.9993
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
 -10.57662       Inf
sample estimates:
mean in group automatic    mean in group manual 
               17.14737                24.39231 

Здесь мы видим, что t.test() выполняется автоматически > вручную, и, следовательно, p-значение равно 0,9993.

Чтобы правильно запустить тест, мы изменим его, чтобы использовать аргумент alt="less".

> t.test(mtcars$mpg ~ mtcars$trans,alt="less")

    Welch Two Sample t-test

data:  mtcars$mpg by mtcars$trans
t = -3.7671, df = 18.332, p-value = 0.0006868
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
      -Inf -3.913256
sample estimates:
mean in group automatic    mean in group manual 
               17.14737                24.39231 

>

Здесь мы видим сообщаемое значение p как 0,0006, что означает, что мы отвергаем нулевую гипотезу в пользу альтернативной гипотезы о том, что автомобили с автоматической коробкой передач имеют более низкий средний пробег на галлон, чем автомобили с механической коробкой передач.

person Len Greski    schedule 15.04.2018
comment
Нулевая гипотеза должна быть mpg of manual transmission cars = mpg of automatic transmission cars - person ; 19.03.2019
comment
@JasonBaik - опция alt="less" указывает односторонний тест. В одностороннем тесте альтернативная гипотеза: мили на галлон (ручной) > мили на галлон (автоматический). Таким образом, нулевая гипотеза состоит в том, что мили на галлон (вручную) ‹ = мили на галлон (автоматически), потому что вся область отбраковки находится на одной стороне нормальной кривой. Для двустороннего теста нулевая гипотеза такова: мили на галлон (вручную) = мили на галлон (автоматически), но мы не проводили двусторонний тест. В моем ответе используется односторонний тест, потому что ОП задал вопрос, на который лучше всего ответить с помощью одностороннего t-теста, а не двустороннего теста. - person Len Greski; 19.03.2019