Выделение отдельных областей диаграммы рассеяния в ggplot

Мне нужно обсудить график рассеяния и хотелось бы обратиться к конкретным областям сюжета. Есть ли способ "выделить" отдельные разделы сюжета? Возможно, с коробками и ярлыками, как показано ниже?

set.seed(1410)
dsmall<-diamonds[sample(nrow(diamonds), 100), ]
df<-data.frame("x"=dsmall$carat, "y"=dsmall$price)

p <-ggplot(df, aes(x, y)) 
p <- p + geom_point(alpha=2/10, shape=21, fill="blue", colour="black", size=5)

enter image description here

Ответ 1

Для одной области проще всего использовать annotate, сначала с rect, затем text:

p + annotate("rect", xmin=1.5, xmax=2.5, ymin=12500, ymax= 18000, 
             fill=NA, colour="red") +
    annotate("text", x=1.75, y=17000, label="Region A", size=8)

enter image description here


Для нескольких регионов вы можете поместить данные в фрейм данных и использовать geom_text и geom_rect:

regions <- data.frame(
  xmin=c(1.5, 1, 0),
  xmax=c(2.5, 2, 1),
  ymin=c(12500, 5000, 0),
  ymax=c(17500, 12500, 5000),
  x   =c(2, 1.5, 0.5),
  y   =c(15000, 7500, 2500),
  lab = paste("Region", LETTERS[1:3])
)

p + 
  geom_rect(data=regions, aes(xmin=xmin, xmax=xmax, ymin=ymin, ymax=ymax), 
            fill=NA, colour="red") +
  geom_text(data=regions, aes(x=x, y=y, label=lab)) 

enter image description here