Что мы понимаем под "верхним процентилем" или задержкой на основе TP?

Когда мы обсуждаем производительность распределенной системы, мы используем термины tp50, tp90, tp99.99 TPS. Может ли кто-нибудь объяснить, что мы подразумеваем под этим?

Ответ 1

tp90 - это минимальное время, в течение которого подавалось 90% запросов. Представьте, что у вас есть время:

10s
1000s
100s
2s

Вычисление TP очень просто:

  • сортировать все время в порядке возрастания: [2s, 10s, 100s, 1000s]
  • найдите последний элемент, который вам нужно рассчитать. Для TP50 он будет перекрывать (4 *.5) = 2 запроса. Вам нужен второй запрос. Для TP90 это будет ceil (4 *.9) = 4. Вам нужен 4-й запрос.
  • получить время для элемента, указанного выше. TP50 = 10s. TP90 = 1000s