В настоящее время я оцениваю HBase как хранилище данных, но один вопрос остался без ответа: HBase хранит много копий одного и того же объекта на многих узлах (aka replication). Поскольку HBase имеет так называемую сильную согласованность (в отличие от последовательной последовательности), она гарантирует, что каждая реплика возвращает одно и то же значение при чтении.
Как я понял концепцию HBase, при чтении значений сначала запрашивается мастер HBase для (должно быть более одного) RegionServer, предоставляющего данные. Затем я могу выдавать запросы на чтение и запись без изобретения мастера. Как может работать репликация?
- Как HBase обеспечивает согласованность?
- Как внутренние операции записи?
- Делает блок операций записи до тех пор, пока не будут записаны все реплики (= > синхронная репликация). Если да, кто управляет этим переводом?
- Как HDFS входит в игру?
Я уже читал BigTable-Paper и искал документы, но я больше не нашел информации об архитектуре HBase.
Спасибо!