У меня есть (огромный) набор похожих файлов данных. Набор постоянно растет. Размер одного файла составляет около 10K. Каждый файл должен быть сжат сам по себе. Сжатие выполняется с помощью библиотеки zlib, которая используется классом java.util.zip.Deflater
. При передаче словаря алгоритму Deflate с помощью setDictionary
я могу улучшить коэффициент сжатия.
Есть ли способ (алгоритм) найти "оптимальный" словарь, т.е. словарь с общей оптимальной степенью сжатия?
См. руководство zlib