Есть ли у кого-нибудь опыт использования Neo4j с наборами данных размером в терабайт? Я хотел бы услышать о ваших экспериментах с тем, как Neo4j выполняет
Опыт использования Neo4j с большими наборами данных?
Ответ 1
Пока ваш диск является большим и достаточно быстрым, а ваша память позволяет кэшировать соответствующую (горячую) часть ваших данных, вы не должны сталкиваться с проблемами.
Существуют оптимизации для настройки хранилища данных Neo4j по конкретным потребностям.
В противном случае это зависит от типа вашего набора данных. Производительность запроса не должна быть проблемой, вставка производительности может пострадать, если вам придется делать много индексов для присоединения к импортированным узлам (но команда Neo4j работает над этим).
Возможно, вам следует присоединиться к списку рассылки Neo4j, чтобы более последовательно отвечать на все ваши вопросы.
Ответ 2
Мы использовали Neo4j для хранения графика пользователей и их отношений с приблизительным размером в 10 000 узлов и 400 000 отношений, некоторые операции, поддерживаемые в структуре графика, такие как получение друзей пользователя Neo4j довольно быстро.
Это всегда зависит от того, какие запросы вы собираетесь запускать в базе данных, а также на сервере, хранящем вашу базу данных.
Ответ 3
Я использую neo4j для обработки графика с 4 000 000 нидов и 42 000 000 ребер, и он отлично работает.
Попробовали найти кратчайший путь между двумя случайными узлами, и потребовалось менее 100 мс. Извлечение соседства соседа, в том числе друзей, друзей друзей и друзей друзей друзей, также почти не требует времени, пока реляционная база данных на том же компьютере позволяет вам пойти на обед, пока он не исполнится.