Недавно я рассматриваю возможность использования развертывания Amazon RDS Multi-AZ для службы в производственной среде, и я прочитал связанные документы.
Однако у меня есть вопрос об откате. В FAQ по Amazon RDS переход на другой ресурс описывается следующим образом:
В: Что происходит при переходе на многоадресный режим и сколько времени требуется?
Отказоустойчивость автоматически обрабатывается Amazon RDS, чтобы вы могли возобновить операциях с базой данных как можно быстрее без административных вмешательство. Когда не удается, Amazon RDS просто переворачивает каноническое (CNAME) для вашего экземпляра БД, чтобы указать в режиме ожидания, который, в свою очередь, стал новым первичным. Мы призываем вас следовать рекомендациям и выполнять повторную попытку подключения к базе данных в прикладного уровня. Время отказоустойчивости зависит от времени восстановление завершено. От начала до конца, при отказе обычно завершается в течение трех минут.
Из приведенного выше описания я предполагаю, что должна существовать служба мониторинга, которая могла бы обнаружить отказ основного экземпляра и сделать перелистывание.
Мой вопрос: в какой AZ это приложение для мониторинга? Существует 3 возможности: 1. Тот же AZ, что и основной 2. Тот же AZ, что и в режиме ожидания 3. Другой AZ
По-видимому, 1 & 2 не будет иметь места, поскольку он не может справиться с ситуацией, когда весь AZ недоступен. Итак, если это так, то что произойдет, если AZ службы мониторинга снизится? Есть ли еще одна служба для мониторинга этой службы мониторинга? Кажется, это бесконечное домино.
Итак, как Amazon обеспечивает доступность RDS в развертывании Multi-AZ?