У меня большой набор чисел, возможно, в диапазоне нескольких гигабайт. Первая проблема заключается в том, что я не могу хранить все это в памяти. Во-вторых, любая попытка их добавления приведет к переполнению. Я думал использовать больше скользящего среднего, но он должен быть точным. Любые идеи?
Это все числа с плавающей запятой.
Это не считывается из базы данных, это CSV файл, собранный из нескольких источников. Он должен быть точным, поскольку он хранится как часть секунды (например, 0.293482888929), а среднее скользящее среднее может быть разницей между .2 и .3
Это набор из #, представляющий, как долго пользователи реагировали на действия определенной формы. Например, при показе сообщения, сколько времени потребовалось, чтобы нажать OK или Отменить. Данные были отправлены мне в секундах. Например, 1.2347 секунд. Преобразование его в миллисекунды, и я переполняю int, long и т.д. Довольно быстро. Даже если я не конвертирую его, я все равно переполняю его довольно быстро. Я думаю, что один ответ ниже правильный, что, возможно, мне не нужно быть на 100% точным, просто посмотрите в пределах определенного диапазона внутри отдельного StdDev, и я буду достаточно близко.