У меня возникает вопрос о выборе хеш-функций для фильтров Bloom:
- Какие функции использовать?
В почти каждом документе/документе вы можете прочитать, что хеш-функции, используемые в цветном фильтре, должны быть независимыми и равномерно распределены.
Я знаю, что подразумевается под этим (независимым и равномерно распределенным), но мне трудно найти аргументацию или дискуссию, которые хеш-функции выполняют эти требования и поэтому подходят. Во многих сообщениях я читал о предложениях по использованию FNV или хеш-функции Murmur, но не почему (или, по крайней мере, без доказательства) они подходят.
Спасибо заранее!