Я пытаюсь добиться следующего:
Выберите все записи, которые у меня есть, где собственность - это объекты, которые я создал. Объекты, созданные пользователем, которыми управляет пользователь, где пользовательское управление может находиться в иерархии пользователей, управляющих пользователями.
Владение явно прямолинейно и может быть обработано простым идентификатором, соответствующим владельцу. Иерархия управления пользователями меня немного зациклилась, чтобы не выполнять тяжелую работу через большие списки идентификаторов (вы можете просто найти каждого управляемого пользователя и перечислить каждый объект, созданный любым из этих пользователей, используя предложение IN или подобное).
В идеале это все происходит в одном запросе, так что нормальный пейджинг и условия могут возникать.
Я думал, что, возможно, были некоторые математики, чтобы сделать это - с идентификаторами, которые можно каким-то образом хэшировать, чтобы определить, принадлежат ли они кому-либо в цепочке команд.
Любые ссылки для такого рода вещей?
Я пропустил что-то очевидное?
Использование MongoDB, если это имеет значение, но с радостью подумайте о других базах данных для вдохновения.
UPDATE: создали коллекцию MongoDB с 1 000 000 записей, чтобы получить достоверные данные о том, что представляет собой управляемое количество параметров для предложения IN в запросе. Будет отчитываться, когда у меня будет какая-то конкретная информация.
АНАЛИЗ
Использование ruby-mongo-драйвера и рубинового теста lib.
Коллекция MongoDB с записями 1039944
Записи определяются как:
{
first_name: String,
last_name: String,
email: String,
phone: String,
company: String,
owner: BSON::ObjectId
}
С произвольно сгенерированными значениями для всех полей.
Поле Owner имеет индекс.
Выполнение запросов со следующими условиями:
conditions = {"owner" => { "$in" => id_list }}
opts = {skip: rand, limit: 100}
Результаты:
# 10201 ids
# user system total real
# 0: 0.240000 0.000000 0.240000 ( 0.265148)
# 1: 0.240000 0.010000 0.250000 ( 0.265757)
# 2: 0.240000 0.000000 0.240000 ( 0.267149)
# 3: 0.240000 0.000000 0.240000 ( 0.269981)
# 4: 0.240000 0.000000 0.240000 ( 0.270436)
# Find: 0.240000 0.000000 0.240000 ( 0.266709)
# 5201 ids
# user system total real
# 0: 0.120000 0.000000 0.120000 ( 0.133824)
# 1: 0.120000 0.000000 0.120000 ( 0.134787)
# 2: 0.110000 0.000000 0.110000 ( 0.133262)
# 3: 0.110000 0.000000 0.110000 ( 0.136046)
# 4: 0.120000 0.000000 0.120000 ( 0.141220)
# Find: 0.130000 0.000000 0.130000 ( 0.139110)
# 201 ids
# user system total real
# 0: 0.010000 0.000000 0.010000 ( 0.006044)
# 1: 0.000000 0.000000 0.000000 ( 0.004681)
# 2: 0.010000 0.000000 0.010000 ( 0.004578)
# 3: 0.000000 0.000000 0.000000 ( 0.007048)
# 4: 0.010000 0.000000 0.010000 ( 0.008487)
# Find: 0.000000 0.000000 0.000000 ( 0.005990)
# 1 id (NOT using IN)
# user system total real
# 0: 0.000000 0.000000 0.000000 ( 0.002868)
# 1: 0.000000 0.000000 0.000000 ( 0.004937)
# 2: 0.010000 0.000000 0.010000 ( 0.003151)
# 3: 0.000000 0.000000 0.000000 ( 0.002983)
# 4: 0.000000 0.000000 0.000000 ( 0.003313)
# Find: 0.000000 0.000000 0.000000 ( 0.002742)
Даже со списком идентификаторов 10k в запросе производительность довольно быстро.