Мне нужно написать задание MapReduce, которое получает все строки в заданном диапазоне дат (например, последний месяц). Это был бы прозвище, когда My Row Key начинался с Date. Но мои частые запросы Hbase начинаются с значений ключа.
Ключ "Моя строка" в точности A | B | C | 20120121 | D. Если комбинация A/B/C вместе с датой (в формате YearMonthDay) делает уникальный идентификатор строки.
Мои таблицы Hbase могут иметь до нескольких миллионов строк. Должен ли мой Mapper читать всю таблицу и фильтровать каждую строку, если она попадает в заданный диапазон дат, или Scan/Filter может помочь справиться с этой ситуацией?
Может ли кто-нибудь предложить (или фрагмент кода) способ эффективно справиться с этой ситуацией?
Спасибо -Panks