Я запутался в значении следующих вариантов geom_density
в ggplot:
Кто-нибудь может объяснить разницу между этими четырьмя вызовами:
- geom_density (aes_string (x = 'myvar')) VS
- geom_density (aes_string (x = 'myvar', y = '.. плотность..')) VS
- geom_density (aes_string (x = 'myvar', y = '.. scaled..')) VS
- geom_density (aes_string (x = 'myvar', y = '.. count../sum (.. count..)'))?
Я понимаю, что:
-
geom_density
будет производить плотность, площадь которой под кривой суммируется до 1 -
geom_density
с..density..
в основном делает то же самое...? -
..count../sum(..count..)
будет нормализовать высоту пика, чтобы быть больше похожей на нормированную гистограмму, гарантируя, что все высоты суммируются до 1 -
..count..
сам по себе без знаменателя будет просто умножать каждый бит на # элементов в нем - параметр
..scaled..
сделает так, чтобы максимальное значение плотности было равно 1.
Я нахожу ..scaled..
очень противоречивым и никогда не видел, чтобы он использовался, если моя интерпретация его верна, поэтому я хотел бы проигнорировать это. Я в основном ищут разъяснения различий между geom_density
и своего рода нормализованным графиком плотности, который, как я предполагаю, требует аргумента ...count../...
. спасибо.
(Связано: Ошибка с переменной ggplot2 для преобразования в y и с использованием stat = "bin" )