Как создать эквивалент сводных диаграмм Excel в R / ggplot2

Я делаю много сводных диаграмм, и меня разочаровывает Excel. Три недели назад (по состоянию на 20.02.2015) я начал изучать R в надежде стать более продуктивным. Покрыв основы, я установил ggplot2 в свою R-Studio. Я искал учебные пособия по ggplot2, но не нашел ничего, имеющего отношение к тому, что мне нужно.

Поскольку я новичок в Stack Overflow, я не могу опубликовать изображение для иллюстрации, но мои данные часто включают 2 непрерывные переменные и 2 дискретные переменные, которые я использую в качестве факторов. Мне нужно рассчитать и изобразить среднее значение ± стандартное отклонение (шкалы ошибок) трех повторов для переменной 1 на одной оси (в виде столбцов) плюс среднее значение для трех повторов для переменной 2 на второй оси (как диаграмма рассеяния).

Мои вопросы:

1) можно ли это сделать с помощью R / ggplot2?

2) Где я могу найти инструкции, руководства и т. Д., В которых показано, как это сделать?

Я сам готов пойти и поискать иголку ... если бы я только смог найти стог сена!

Спасибо!


person carlite71    schedule 20.02.2015    source источник
comment
Этот вопрос может быть истолкован как не по теме, как это обычно бывает с запросами материалов / руководств. У вас, вероятно, будут лучшие результаты, если вы зададите конкретный вопрос по программированию, который вам нужен, с некоторыми примерами данных и желаемым результатом.   -  person Ajean    schedule 21.02.2015
comment
Изучите их для ggplot2 и изучите dplyr. Я предполагаю, что вы можете считывать свои данные в R. hopstat .wordpress.com / 2014/10/30 / и Getgeneticsdone.com/2015/02/r-ggplot2-graph-catalog.html Есть книга, которую я мог бы получить, и много кода R для графиков   -  person lawyeR    schedule 21.02.2015
comment
Можете ли вы добавить URL-адрес к примеру того типа графика, который вы хотите создать, и привести несколько примеров данных, типичных для того, с чем вы работаете? См. Здесь, чтобы узнать, как это сделать: stackoverflow.com/questions/5963269/   -  person Ben    schedule 21.02.2015


Ответы (2)


Вы можете попробовать что-то подобное.

1: фильтр

basic_summ = filter(mprices, state %in% c("California", "New York", "Illinois"))

2: настроить фрейм данных для групповой обработки.

basic_summ = group_by(basic_summ, quality, state)

3. Рассчитайте три сводных показателя

basic_summ = summarise(basic_summ, 
                        sum_amount = sum(amount),
                        avg_ppo = mean(ppo),
                        avg_ppo2 = sum(price) / sum(amount))

basic_summ
person Danny M.    schedule 20.02.2015

Вы можете сделать это с помощью пакета rpivotTable. Вот пример использования встроенного набора данных trees, отображающий средний объем как функцию высоты дерева:

library(rpivotTable)
rpivotTable(trees, aggregatorName="Average",  vals="Volume", 
  cols="Height", rendererName="Line Chart")

Сводная диаграмма создана из примера кода

person Anthony    schedule 28.06.2017