Чтобы получить полное представление о наборах данных, одно из решений состоит в том, чтобы показать средние значения вместе с некоторыми планками погрешностей вокруг средних значений, а также неустойчивыми точками отдельных оценок и, наконец, сглаженным распределением этих оценок. Например, взято из Ян, Б.В. и др. (2021).
Как мы можем наложить точки, полосы погрешностей, точки дрожания и гистограмму на один и тот же график с небольшим интервалом между ними?
Для иллюстрации предположим, что данные
x1=c(2.0,2.1,2.5,2.7,2.8,3.1)
x2=c(2.5,2.9,3.0,3.2,3.3,3.9)
x=data.frame(cbind(x1,x2))
и что статистика, используемая для построения точек и планок погрешностей,
group = c(1, 2)
centr = c(2.53, 3.13)
width = c(0.50, 0.50)
stats = data.frame( cbind(group, centr, centr-width, centr+width ) )
Мне удалось сделать график с точками и планками ошибок с
ggplot( stats ) +
geom_point( aes(x=group, y=centr, size = 1) ) +
geom_errorbar(stat="identity", position=position_dodge(.9), aes( x=group, ymin=V3, ymax=V4), width=0.1 ) +
scale_y_continuous("mean ratings")
и точки дрожания с
ggplot( x ) +
geom_jitter( aes( y= x1, x = 1, col=1), width=0.15 ) +
geom_jitter( aes( y= x2, x = 2, col=2), width=0.15 )
но я понятия не имею, что касается сглаженных распределений.
Кроме того, если я хочу, чтобы две группы данных были разделены (точка первой группы, полоса ошибок, точки дрожания и гистограмма слева, скажем, и точка второй группы, полоса ошибок, точки дрожания и гистограмма справа), какие изменения потребуются?