Вероятность выбора элемента из набора

Ожидаемая вероятность случайного выбора элемента из набора из n элементов равна P = 1.0/n. Предположим, что я проверил Р с помощью несмещенного метода достаточно много раз. Каков тип распределения P? Ясно, что P не является нормально распределенным, так как не может быть отрицательным. Таким образом, могу ли я правильно предположить, что P гамма распределена? И если да, каковы параметры этого распределения? Гистограмма вероятностей выбора элемента из 100-элементного набора в 1000 раз показана здесь.

Есть ли способ преобразовать это в стандартный дистрибутив

Теперь предположим, что наблюдаемая вероятность выбора данного элемента была P * (P *!= P). Как я могу оценить, является ли статистическая значимость смещения?

EDIT: Это не домашнее задание. Я занимаюсь хобби, и мне нужна эта статистика. Я сделал свою последнюю домашнюю работу ~ 10 лет назад:-)

Ответ 1

С повторениями ваше распределение будет биномиальным. Итак, пусть X - это количество раз, когда вы выбираете какой-либо фиксированный объект, с M полным выбором

P {X = x} = (M выбираем x) * (1/N) ^ x * (N-1/N) ^ (M-x)

Вы можете найти это трудно вычислить для больших N. Оказывается, что при достаточно большом N это фактически сходится к нормальному распределению с вероятностью 1 (теорема о центральном пределе).

В случае, если P {X = x} будет задано нормальным распределением. Среднее будет M/N, а дисперсия будет M * (1/N) * (N-1)/N.

Ответ 2

Это четкое биномиальное распространение с p = 1/(количество элементов) и n = (количество испытаний).

Чтобы проверить, отличается ли наблюдаемый результат от ожидаемого результата, вы можете выполнить двухкомпонентный тест .

Примеры кубиков на двух страницах Википедии должны дать вам несколько хороших рекомендаций относительно того, как сформулировать вашу проблему. В 100-элементном 1000 пробном примере это будет похоже на то, чтобы прокатать 100-стороннюю матрицу 1000 раз.

Ответ 3

Как отмечали другие, вам нужно биномиальное распространение. Ваш вопрос, кажется, подразумевает интерес к непрерывному приближению к нему. Фактически это может быть приблизительное по нормальному распределению, а также Пуассона.