У меня есть кластер 2 node apache cassandra (2.0.3) с коэффициентом rep от 1. Я изменяю множитель rep на 2, используя следующую команду в cqlsh
ALTER KEYSPACE "mykeyspace" WITH REPLICATION = { 'class' : 'SimpleStrategy', 'replication_factor' : 2 };
Затем я попытался запустить рекомендуемый "ремонт nodetool" после выполнения этого типа alter.
Проблема в том, что эта команда иногда заканчивается очень быстро. Когда он заканчивается, он обычно говорит "Потерянное уведомление...", а код выхода не равен нулю.
Поэтому я просто повторяю этот "ремонт nodetool" до тех пор, пока он не завершится без ошибок. Я также проверяю, что "состояние nodetool" сообщает о ожидаемом дискового пространства для каждого node. (с номером rep 1, каждый node скажет около 7 ГБ каждый, и я ожидаю, что после восстановления nodetool каждый из них будет составлять 14 ГБ каждый, если не использовать кластер в среднем)
Есть ли более правильный способ определить, что "ремонт nodetool" завершен в этом случае?