Я использую SHA-1 для обнаружения дубликатов в файлах обработки программы. Не требуется криптографических сильных и может быть обратимым. Я нашел этот список быстрых хеш-функций https://code.google.com/p/xxhash/
Что мне выбрать, если мне нужна более быстрая функция и столкновение по случайным данным рядом с SHA-1?
Может быть, 128-битный хеш достаточно хорош для дедупликации файлов? (против 160 бит sha-1)
В моей программе хэш рассчитывается на chancks от 0 до 512 КБ.