Я пытаюсь реализовать алгоритм Argon2 в библиотеке аутентификации. Я хочу предоставить пользователям несколько полезных советов по настройке параметров.
Хотя я понимаю, как параметры memory_cost
и threads
влияют на алгоритм, я не могу обернуться вокруг параметра time_cost
.
Что говорит PHP документ:
time_cost (integer) - максимальное количество времени, которое может потребоваться для вычисления хэша Argon2. По умолчанию PASSWORD_ARGON2_DEFAULT_TIME_COST.
Опрос 1 - значение по умолчанию равно 2. Кажется, оно представляет время, к сожалению, единица кажется отсутствующей. Это в секундах? Миллисекунды?
Этот SO ответ говорит, что по умолчанию 2 секунды.
Что говорит спецификация Argon2:
В главе 3.1 "Входные данные" здесь нет упоминания о времени, только о количестве итераций.
Количество итераций
t
(используется для настройки времени выполнения независимо от объема памяти) может быть любым целым числом от 1 до 2 ^ 32−1;
Временное значение определено в главе 9 "Рекомендуемые параметры":
Вычислите максимальное количество
x
времени (в секундах), которое может позволить каждый звонок[...]
Запустите схему типа
y
, памятьm
иh
полосы и потоки, используя разное количество проходовt
. Вычислите максимальное значениеt
таким образом, чтобы время работы не превышалоx
. Если оно превышаетx
даже дляt = 1
, уменьшитеm
соответственно.Хэшируйте все пароли с только что определенными значениями
m
,h
иt
.
Опрос 2 - Значит ли это, что PHP выставляет количество времени x
и определяет правильное количество итераций t
?
Что говорит PHP RFC:
Стоимость времени, которая определяет время выполнения алгоритма и количество итераций
[...]
Затраты времени представляют количество раз, когда алгоритм хеширования будет запущен.
Допрос 3 - Они говорят как о времени, так и о количестве итераций. Теперь я еще больше запутался. Это время или количество итераций? Если я запускаю хэш с time_cost = 2
, значит ли это, что это займет 2 секунды?
Эталон
Чтобы помочь мне немного понять, я сделал этот небольшой сценарий тестирования. Я получил следующий результат (1 поток):
m_cost (MB) | 1 | 2 | 4 | 8 | 16 | 32 | 64 | 128 | 256
=====================================================
t_cost=1 | 1 | 2 | 5 | 10 | 24 | 46 | 90 | 188 | 348
t_cost=2 | 2 | 4 | 8 | 18 | 39 | 75 | 145 | 295 | 636
t_cost=3 | 3 | 6 | 12 | 26 | 53 | 102 | 209 | 473 | 926
t_cost=4 | 5 | 9 | 30 | 56 | 78 | 147 | 309 | 567 |1233
t_cost=5 | 4 | 9 | 19 | 40 | 79 | 165 | 359 | 690 |1372
t_cost=6 | 5 | 12 | 23 | 49 | 93 | 198 | 399 | 781 |1777
t_cost=7 | 6 | 14 | 29 | 53 | 118 | 259 | 508 |1036 |2206
t_cost=8 | 8 | 16 | 33 | 82 | 179 | 294 | 528 |1185 |2344
Я до сих пор не понимаю, как time_cost
может быть временем в секундах.
Если это верхняя граница (имеется в виду максимальное время, которое он может выполнить), то это даже не полезно. Например, t_cost=8
и m_cost=16MB
могут показаться разумными, поскольку для их запуска требуется около 200 мс. Но это означает, что алгоритм может однажды занять до 8 секунд для запуска? Юзабилити была бы катастрофической!
Я действительно пытался сделать свое исследование, и мне не очень удобно, что мне нужно попросить, чтобы понять это.
Но это действительно сбивает с толку. Поскольку это связано с безопасностью, я очень хочу докопаться до сути.
Спасибо за ваши идеи!