У меня есть df, как показано ниже:
fruit <- data.frame(Sample=1:100,
Fruit=c(rep("Apple", 10), rep("Strawberry", 25), rep("Grape", 20),
rep("Watermelon", 15), rep("Lime", 11), rep("Blueberry", 10),
rep("Plum", 9)),
Color=c(rep("Red", 30), rep("Green", 45),
rep("Blue", 25)),
Ripe=c(rep(c(T, F), 50)))+
fruit$Fruit <- factor(fruit$Fruit, unique(fruit$Fruit))+
fruit$Color <- factor(fruit$Color, unique(fruit$Color))
Затем я построил гистограмму как:
library(ggplot2)
ggplot(fruit, aes(Color)) +
geom_bar(stat="count", position="fill",aes(fill=Color, color=Color,alpha=Ripe)) +
scale_y_continuous(labels=scales::percent)+
scale_alpha_discrete(range=c(1,0.6))+
theme(axis.title.x = element_blank(), axis.text.x = element_blank(), axis.ticks.x = element_blank())+
scale_color_manual(values = c("Black", "Black", "Black"))+
guides(fill = guide_legend(override.aes = list(colour = NA)))
И вот результат:
Что хотелось бы получить, так это шкалу оси Y как количество наблюдений от переменной цвета, а не частоту (проценты).
С ответом, который @PoGibas дал ниже, я смог поместить общее количество наблюдений для каждого цвета над каждой полосой ... но мне интересно, знаете ли вы, как поместить общее n наблюдений для ИСТИНА в каждой цветной полосе. В этом случае будет два наблюдения n для каждой полосы, одно над полосой будет означать общее n каждого цвета, а над полосой ИСТИНА будет наблюдение ИСТИНА n для этого конкретного цвета ...