Apache Giraph vs Neo4j: Являются ли алгоритмы обхода для разных узлов в разных системах обработки графов? Если бы мы шли, скажем, социальный граф, использующий Giraph и Neo4j, для данных, хранящихся в одной машине (не распределенной), которая будет работать лучше и почему?
Neo4j против Apache Giraph в обход графика
Ответ 1
Руки вниз Neo4j. Графические вычисления графиков выполняются как задания Hadoop, потому что они предназначены для работы с большими распределенными графами. Накладные расходы на управление этими заданиями слишком велики, чтобы быть эффективными на мелкомасштабном графике, запущенном на псевдораспределенном одиночном кластере.
Не только это, но специальность Neo4j - это обход. Большая причина этого в том, что Neo4j фактически хранит смежные отношения в двусвязных списках в файловой системе. Просмотрите эту запись в блоге:
http://digitalstain.blogspot.nl/2010/10/neo4j-internals-file-storage.html
Это объясняет, как Neo4j оптимизировал способ хранения графика для быстрых операций с графами, таких как обходы.