У меня возникли проблемы с построением гистограммы как pdf (вероятность)
Я хочу, чтобы сумма всех частей равнялась площади одного, поэтому проще сравнивать между наборами данных. По какой-то причине всякий раз, когда я указываю разрывы (по умолчанию 4 или что-то ужасное), он больше не хочет отображать ячейки в качестве вероятности и вместо этого отображает ячейки как частоту.
hist(data[,1], freq = FALSE, xlim = c(-1,1), breaks = 800)
Чему я должен изменить эту строку? Мне нужно распределение вероятности и большое количество ящиков. (У меня 6 миллионов точек данных)
Это в справке R, но я не знаю, как ее переопределить:
freq logical; если TRUE, график гистограммы представляет собой представление частоты, составляющая отсчетов результата; если FALSE, вероятность плотности, плотности компонентов (так, чтобы гистограмма имела общая площадь одного). По умолчанию TRUE, если и только если разрывы эквидистант (и вероятность не указана).
Спасибо
изменить: подробности
hmm, поэтому мой сюжет идет выше 1, что довольно запутанно, если это вероятность. Теперь я вижу, как это связано с шириной бункера. Я более или менее хочу сделать каждый бин стоимостью 1 балл, имея еще много бункеров. Другими словами, высота бункера не должна превышать 1.0, если только она не равна 1.0, а все остальные бункеры равны 0.0. В настоящее время у меня есть бункеры, которые создают горб вокруг 15.0
изменить: высота на% точек в корзине @Dwin: Итак, как мне построить вероятность? Я понимаю, что интеграция по-прежнему даст мне 1,0 из-за единиц по оси x, но это не то, что я хочу. Скажем, у меня есть 100 очков, и 5 из них попадают в первый ящик, а затем этот бункер должен быть на высоте 0,05. Это то, чего я хочу. Я делаю это неправильно, и есть другой способ сделать это?
Я знаю, сколько у меня очков. Есть ли способ разделить количество каждого бина в гистограмме частоты на это число?