У меня есть приложение, которое требует аналитики для разного уровня агрегации и что рабочая нагрузка OLAP. Я хочу также часто обновлять свою базу данных.
Например, вот как выглядит мое обновление (схема выглядит так: время, dest, source ip, browser → посещения)
(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105
(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110
...
(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110
И затем я хочу спросить, что представляет собой общий визит на www.stackoverflow.com из браузера Firefox в прошлом месяце.
Я понимаю, что система Vertica может сделать это относительно дешево (производительность и масштабируемость мудрая, но, скорее, не по затратам). У меня здесь два вопроса.
1) Есть ли продукт с открытым исходным кодом, который я могу использовать для решения этой проблемы? В частности, насколько хорошо работает система Мондриана? (масштабируемость и производительность) 2) Существует ли базовое решение HBase или Hypertable (очевидно, что это голая HBase/Hypertable не может это сделать)? - но если есть проект, основанный на HBase/Hypertable, масштабируемость, вероятно, не будет проблемой IMO)?
Спасибо!