Я пытаюсь построить дистрибутив CDF с помощью R и ggplot2. Однако я затрудняюсь при построении функции CDF после преобразования оси Y для получения прямой линии. Этот вид сюжета часто используется на графических страницах Gumbel, но здесь я буду использовать в качестве примера нормальное распределение.
Я генерирую данные и накладываю кумулятивную функцию плотности данных вместе с функцией. Они хорошо подходят. Однако, когда я применяю преобразование оси Y, они больше не подходят.
sim <- rnorm(100) #Simulate some data
sim <- sort(sim) #Sort it
cdf <- seq(0,1,length.out=length(sim)) #Compute data CDF
df <- data.frame(x=sim, y=cdf) #Build data.frame
library(scales)
library(ggplot2)
#Now plot!
gg <- ggplot(df, aes(x=x, y=y)) +
geom_point() +
stat_function(fun = pnorm, colour="red")
gg
И выход должен быть чем-то вроде:
Хорошо!
Теперь я пытаюсь преобразовать ось Y в соответствии с используемым распределением.
#Apply transformation
gg + scale_y_continuous(trans=probability_trans("norm"))
Точки преобразуются правильно (они лежат на прямой линии), но функция не является!
Однако все работает нормально, если мне это нравится, вычисляя CDF с помощью ggplot:
ggplot(data.frame(x=sim), aes(x=x)) +
stat_ecdf(geom = "point") +
stat_function(fun="pnorm", colour="red") +
scale_y_continuous(trans=probability_trans("norm"))
Почему это происходит? Почему не вычисляет работу CDF с помощью масштабных преобразований?