Проверка значимости в R, определяющая, значительно ли доля в одном столбце отличается от доли в другом столбце в пределах одной переменной.

Я уверен, что это простая команда в R, но по какой-то причине у меня возникли проблемы с поиском решения.

Я пытаюсь запустить несколько перекрестных таблиц (используя команду table()) в R, и каждая вкладка имеет два столбца (лечение и отсутствие лечения). Я хотел бы знать, значительно ли разница между столбцами отличается друг от друга для всех строк (строки представляют собой несколько вариантов ответов из опроса). Меня не интересует общая значимость, только в перекрестной таблице, сравнивающей лечение и отсутствие лечения.

Этот тип анализа очень прост в SPSS (ссылка ниже, чтобы проиллюстрировать, о чем я говорю), но я не могу заставить его работать в R. Знаете ли вы, что я могу это сделать?

http://help.vovici.net/robohelp/robohelp/server/general/projects_fhpro/survey_workbench_MX/Significance_testing.htm

EDITED: Вот пример в R о том, что я имею в виду:

 treatmentVar <-c(0,1,0,1,0,1,0,1,0,1,0,1,0,1,0,1) # treatment is 1 or 0
 question1 <-c(1,2,2,3,1,1,2,2,3,1,1,2,2,3,1,3) #choices available are 1, 2, or 3
 Questiontab <- table(question1, treatmentVar)
 Questiontab

У меня есть такие таблицы ^ (в процентах по столбцу для обработкиVar), и я хотел бы увидеть, есть ли значительная разница между каждым выбором вопроса (строками), переходящими от лечения 0 к лечению 1. Итак, в приведенном выше примере я бы хотите знать, есть ли существенная разница между 4 и 2 (строка 1), 3 и 3 (строка 2) и 1 и 3 (строка 3). Таким образом, в этом примере варианты ответа на вопрос 1 могут существенно различаться для вариантов 1 и 3 (поскольку разница равна 2), но разница для варианта 2 не такова, потому что разница равна нулю. В конечном счете, я пытаюсь определить этот тип значимости. Надеюсь, это поможет.

Спасибо!


person Captain Murphy    schedule 28.11.2011    source источник
comment
Людям будет легче ответить на ваш вопрос, если вы предоставите воспроизводимый пример, включая небольшой примерный набор данных.   -  person joran    schedule 29.11.2011
comment
прости за это. Я только что отредактировал свой вопрос с примером R   -  person Captain Murphy    schedule 29.11.2011


Ответы (2)


Используя ваш пример, либо chisq.test, либо prop.test (эквивалентно в этом случае):

> chisq.test(Questiontab)

        Pearson's Chi-squared test

data:  Questiontab 
X-squared = 1.6667, df = 2, p-value = 0.4346

Warning message:
In chisq.test(Questiontab) : Chi-squared approximation may be incorrect
> prop.test(Questiontab)

        3-sample test for equality of proportions without continuity
        correction

data:  Questiontab 
X-squared = 1.6667, df = 2, p-value = 0.4346
alternative hypothesis: two.sided 
sample estimates:
   prop 1    prop 2    prop 3 
0.6666667 0.5000000 0.2500000 

Warning message:
In prop.test(Questiontab) : Chi-squared approximation may be incorrect

Обратите внимание на предупреждение; эти тесты не обязательно подходят для таких небольших чисел.

person Brian Diggs    schedule 28.11.2011

Я думаю, что функция, которую вы ищете, это pairwise.prop.test(). См. пример ?pairwise.prop.test.

person John Colby    schedule 28.11.2011
comment
Спасибо, Джон, но это не совсем то, о чем я прошу. Моя вина, я должен был быть более четким в своем вопросе. Теперь я обновил свой вопрос примером R. Я надеюсь, что это поможет прояснить. - person Captain Murphy; 29.11.2011