Почему t-тест возвращает nan/pandas python

df:

gender   order
F         1
F         1
M         1
F         1
M         1
F         1

Цель: проверить, существенно ли различаются средние значения F и M. Я хочу проверить, есть ли существенная разница между самками и самцами для порядка 1. (Я чувствую, что что-то не так, но я не могу понять это на данном этапе). В результате мой код дает Ttest_indResult(statistic=nan, pvalue=nan); Я использовал этот ref для приведенного ниже кода:

from scipy.stats import ttest_ind
cat1 = df[df['gender']=='F']
cat2 = df[df['gender']=='M']
t_tst_rsult = ttest_ind(cat1['order'], cat2['order'])
print(t_tst_rsult)

person SaNa    schedule 29.07.2021    source источник
comment
Вы смотрели на cat1['order'] и cat2['order']? Действительно ли они серии с плавающей запятой?   -  person DYZ    schedule 29.07.2021
comment
2 группы (M и F) имеют одинаковые значения, поэтому тест не обнаружит различий, следовательно, значения nan p   -  person Simon    schedule 29.07.2021
comment
Как сказал Саймон +1, измените значения в столбце вашего заказа и повторно запустите тот же код, и вы увидите правильные результаты.   -  person sophocles    schedule 29.07.2021
comment
Все записи по порядку имеют значение=1. Считаете ли вы, что t-тест является правильным решением, чтобы увидеть разницу?   -  person SaNa    schedule 29.07.2021
comment
ну так как значения идентичны, буквально никакой разницы не видно   -  person Simon    schedule 29.07.2021
comment
если все в order равно 1, нет стандартного отклонения или вариации, нет смысла проводить какие-либо тесты   -  person StupidWolf    schedule 29.07.2021
comment
Понятно, спасибо.   -  person SaNa    schedule 29.07.2021


Ответы (1)


Лучшей проверкой для этого примера является Один образец теста пропорций на случай, если у кого-то возникнет такая же проблема.

person SaNa    schedule 31.07.2021