Вероятно, есть много похожих вопросов, но они не отвечают на мой сценарий (по крайней мере, я не могу понять).
-
У меня есть, скажем, таблица в HBase с четырьмя семействами столбцов. Основная причина в том, что каждое семейство столбцов имеет разные атрибуты VERSIONS (очень разные).
-
Все столбцы всех семейств не хранят большие данные (например, полнотекстовые), а в среднем 1 КБ (длинные идентификаторы, короткие строки, целые числа и т.д.)
-
Мне нужно получить доступ к данным несколькими способами: сканировать и получать по семейству столбцов, получать все ячейки определенной строки по версии (конкретная версия или диапазон) и, наконец, не последнюю очередь: получить последнюю версию все столбцы данной строки.
Итак, каковы в этом сценарии недостатки наличия четырех семейств столбцов? Имеются ли чтения менее эффективны, поскольку они работают (в случае, если строка не находится в памяти) в разных файлах хранилища?