Не знаю ... Я использую R / RStudio с данными mtcars, dplyr, mutate и команды суммировать. Также попробовал группу по.
Я хочу центрировать значения mtcars $ mpg, затем взять эту информацию и отобразить сводку количества цилиндров по сравнению с центрированными mtcars $ mpg.
Так далеко...
mtcars %>% mutate(centered_mpg = mpg - mean(mpg, na.rm = TRUE)) %>% summarise(centered_mpg, cyl)
Вышеупомянутое дает:
centered_mpg | cyl |
---|---|
0.909375 | 6 |
0.909375 | 6 |
2.709375 | 4 |
1.309375 | 6 |
... | ... |
ВМЕСТО, ХОЧУ:
centered_mpg | cyl |
---|---|
x1 | 4 |
x2 | 6 |
x3 | 8 |
mpg
для каждой группы автомобилей (для каждого значенияcyl
)? Вы хотите среднее центрированное миль на галлон по цилиндру? Или медиана, сумма, что-то еще? Я представляю что-то вродеmtcars %>% mutate(centered_mpg = mpg - mean(mpg, na.rm = TRUE)) %>% group_by(cyl) %>% summarise(mean_centered_mpg = mean(centered_mpg))
, но поменяйтеmean()
внутриsummarize()
на любую функцию, которую вы хотите. - person Gregor Thomas   schedule 12.01.2021