Опыт использования Neo4j с большими наборами данных?

Есть ли у кого-нибудь опыт использования Neo4j с наборами данных размером в терабайт? Я хотел бы услышать о ваших экспериментах с тем, как Neo4j выполняет

Ответ 1

Пока ваш диск является большим и достаточно быстрым, а ваша память позволяет кэшировать соответствующую (горячую) часть ваших данных, вы не должны сталкиваться с проблемами.

Существуют оптимизации для настройки хранилища данных Neo4j по конкретным потребностям.

В противном случае это зависит от типа вашего набора данных. Производительность запроса не должна быть проблемой, вставка производительности может пострадать, если вам придется делать много индексов для присоединения к импортированным узлам (но команда Neo4j работает над этим).

Возможно, вам следует присоединиться к списку рассылки Neo4j, чтобы более последовательно отвечать на все ваши вопросы.

Ответ 2

Мы использовали Neo4j для хранения графика пользователей и их отношений с приблизительным размером в 10 000 узлов и 400 000 отношений, некоторые операции, поддерживаемые в структуре графика, такие как получение друзей пользователя Neo4j довольно быстро.

Это всегда зависит от того, какие запросы вы собираетесь запускать в базе данных, а также на сервере, хранящем вашу базу данных.

Ответ 3

Я использую neo4j для обработки графика с 4 000 000 нидов и 42 000 000 ребер, и он отлично работает.

Попробовали найти кратчайший путь между двумя случайными узлами, и потребовалось менее 100 мс. Извлечение соседства соседа, в том числе друзей, друзей друзей и друзей друзей друзей, также почти не требует времени, пока реляционная база данных на том же компьютере позволяет вам пойти на обед, пока он не исполнится.