aes() и aes_string() производят различное поведение в split_violin_plot

Я пытаюсь использовать функцию из этого post для создания разделенного сюжета для скрипки.

Вот код:

GeomSplitViolin <- ggproto("GeomSplitViolin", GeomViolin, draw_group = function(self, data, ..., draw_quantiles = NULL){
  data <- transform(data, xminv = x - violinwidth * (x - xmin), xmaxv = x + violinwidth * (xmax - x))
  grp <- data[1,'group']
  newdata <- plyr::arrange(transform(data, x = if(grp%%2==1) xminv else xmaxv), if(grp%%2==1) y else -y)
  newdata <- rbind(newdata[1, ], newdata, newdata[nrow(newdata), ], newdata[1, ])
  newdata[c(1,nrow(newdata)-1,nrow(newdata)), 'x'] <- round(newdata[1, 'x']) 
  if (length(draw_quantiles) > 0 & !scales::zero_range(range(data$y))) {
    stopifnot(all(draw_quantiles >= 0), all(draw_quantiles <= 
                                              1))
    quantiles <- ggplot2:::create_quantile_segment_frame(data, draw_quantiles)
    aesthetics <- data[rep(1, nrow(quantiles)), setdiff(names(data), c("x", "y")), drop = FALSE]
    aesthetics$alpha <- rep(1, nrow(quantiles))
    both <- cbind(quantiles, aesthetics)
    quantile_grob <- GeomPath$draw_panel(both, ...)
    ggplot2:::ggname("geom_split_violin", grid::grobTree(GeomPolygon$draw_panel(newdata, ...), quantile_grob))
  }
  else {
    ggplot2:::ggname("geom_split_violin", GeomPolygon$draw_panel(newdata, ...))
  }
})

geom_split_violin <- function (mapping = NULL, data = NULL, stat = "ydensity", position = "identity", ..., draw_quantiles = NULL, trim = TRUE, scale = "area", na.rm = FALSE, show.legend = NA, inherit.aes = TRUE) {
  layer(data = data, mapping = mapping, stat = stat, geom = GeomSplitViolin, position = position, show.legend = show.legend, inherit.aes = inherit.aes, params = list(trim = trim, scale = scale, draw_quantiles = draw_quantiles, na.rm = na.rm, ...))
}

Вот пример набора данных:

set.seed(20160229)
my_data = data.frame(
  y=c(rnorm(1000), rnorm(1000, 0.5), rnorm(1000, 1), rnorm(1000, 1.5)),
  x=c(rep('a', 2000), rep('b', 2000)),
  m=c(rep('i', 1000), rep('j', 2000), rep('i', 1000))
)

Используйте aes() в функции графика, мы могли бы получить нормальный график

ggplot(my_data, aes(x, y, fill=m)) + geom_split_violin()

введите здесь описание изображения

Но если использовать aes_string(), у меня получился странный сюжет, где две скрипки расколоты друг над другом.

ggplot(my_data, aes_string(x='x', y='y', fill='m')) + geom_split_violin()

введите здесь описание изображения

Я плохо понимаю, как aes против aes_string может привести к этой разнице. Надеюсь, кто-нибудь может дать мне подсказку. Большое спасибо!


person xiaoli    schedule 04.10.2018    source источник
comment
Похоже, проблема в проверке grp%%2==1. Вы, кажется, предполагаете, что группы будут в каком-то порядке? Версии aes() и aes_string() по какой-то причине возвращают группы в другом порядке, но построение графика не должно зависеть от этого порядка. Как вы хотите решить, какой из них должен идти слева, а какой — справа?   -  person MrFlick    schedule 04.10.2018
comment
У меня нет особого предпочтения, какой из них идти влево и вправо. Но в данном случае похоже, что оба пошли налево. Вы знаете, как это контролировалось?   -  person xiaoli    schedule 04.10.2018
comment
В репозитории github есть открытая проблема по этому поводу. См. здесь   -  person aosmith    schedule 04.10.2018
comment
Воу, точно такой же вопрос. Спасибо!   -  person xiaoli    schedule 04.10.2018


Ответы (1)


Вместо использования aes_string() вы можете использовать аккуратную оценку приблизиться в ggplot2 3.0 или выше по:

  • преобразование входных строк в переменные с использованием sym()

  • раскавычивайте их внутри aes(), используя !!, чтобы они оценивались

library(tidyverse)

ggplot(my_data, aes(x = !!sym('x'), y = !!sym('y'), fill = !!sym('m'))) + geom_split_violin()

Создана 4 октября 2018 г. с помощью пакета reprex (v0.2.1.9000)

person Tung    schedule 04.10.2018
comment
Спасибо, это работает! Все еще пытаюсь понять, почему они ведут себя по-разному. - person xiaoli; 04.10.2018
comment
Я рекомендую не использовать aes_string, так как он устарел, когда в ggplot2 стало возможным аккуратное вычисление. Я не думаю, что они будут тратить столько времени на его улучшение - person Tung; 05.10.2018