Я ищу элегантный и эффективный способ представления и хранения произвольного распределения вероятностей, построенного с помощью явной выборки.
Ожидается, что распределение будет иметь следующие свойства:
- Образцы представляют собой значения с плавающей запятой, но в принципе можно считать, что разрешение меньше .001
- Образцы выводятся из интервала
[-4000; 4000]
- Однако для любых двух образцов
a
,b
,|a - b| < 40
- В 90% случаев у него будет резкий пик или несколько острых пиков, близких друг к другу.
- 10% времени, он будет иметь пик с неровным плато шириной от 0,5 до 5.
Обычное представление - массив гистограмм - нежелательно в основном из-за компромисса между квантованием/разрешением и пространством. Я предполагаю, что должен существовать метод представления, который адаптивно меняет размер ячейки в зависимости от локальной "сложности".
Пространство вызывает беспокойство, потому что структура данных в виде более высокого уровня будет содержать тысячи ячеек, каждая из которых содержит по меньшей мере одно такое представление вероятности. Желательна простая сериализация для передачи диска или сети, но эффективность не является приоритетом.
Любая помощь будет оценена.