ВВЕДЕНИЕ: у меня есть список из более чем 30000 целочисленных значений в диапазоне от 0 до 47 включительно, например, [0,0,0,0,..,1,1,1,1,...,2,2,2,2,...,47,47,47,...]
, взятых из некоторого непрерывного распределения. Значения в списке не обязательно в порядке, но порядок не имеет значения для этой проблемы.
ПРОБЛЕМА: на основании моего распределения я хотел бы рассчитать значение p (вероятность увидеть большие значения) для любого данного значения. Например, как вы видите, значение p для 0 будет приближаться к 1, а значение p для больших чисел будет стремиться к 0.
Я не знаю, прав ли я, но для определения вероятностей я думаю, что мне нужно согласовать мои данные с теоретическим распределением, наиболее подходящим для описания моих данных. Я полагаю, что для определения наилучшей модели необходим какой-то тест на пригодность.
Есть ли способ реализовать такой анализ в Python (Scipy
или Numpy
)?
Не могли бы вы привести примеры?
Спасибо!