Erlang использовался в производственных системах более 20 лет с процентным соотношением времени безотказной работы 99.9999999%.
Я сделал математику следующим образом:
20*365.25*24*60*60*(1 - 0.999999999) == 0.631 s
Это означает, что в течение 20 лет система имеет менее одной секунды простоя. Я не пытаюсь оспаривать справедливость этого, мне просто интересно, как мы можем отключить систему (по назначению или случайно) всего за 0,661 секунды. Может ли кто-нибудь, кто знаком с большой программной системой, объяснить это нам? Спасибо.
Кто-нибудь знает, как рассчитать время простоя службы через кластер блоков обработки (или машин)?