Эффективно определять владельца записи в иерархии с помощью MongoDB

Я пытаюсь добиться следующего:

Выберите все записи, которые у меня есть, где собственность - это объекты, которые я создал. Объекты, созданные пользователем, которыми управляет пользователь, где пользовательское управление может находиться в иерархии пользователей, управляющих пользователями.

Владение явно прямолинейно и может быть обработано простым идентификатором, соответствующим владельцу. Иерархия управления пользователями меня немного зациклилась, чтобы не выполнять тяжелую работу через большие списки идентификаторов (вы можете просто найти каждого управляемого пользователя и перечислить каждый объект, созданный любым из этих пользователей, используя предложение IN или подобное).

В идеале это все происходит в одном запросе, так что нормальный пейджинг и условия могут возникать.

Я думал, что, возможно, были некоторые математики, чтобы сделать это - с идентификаторами, которые можно каким-то образом хэшировать, чтобы определить, принадлежат ли они кому-либо в цепочке команд.

Любые ссылки для такого рода вещей?

Я пропустил что-то очевидное?

Использование MongoDB, если это имеет значение, но с радостью подумайте о других базах данных для вдохновения.

UPDATE: создали коллекцию MongoDB с 1 000 000 записей, чтобы получить достоверные данные о том, что представляет собой управляемое количество параметров для предложения IN в запросе. Будет отчитываться, когда у меня будет какая-то конкретная информация.

АНАЛИЗ

Использование ruby-mongo-драйвера и рубинового теста lib.

Коллекция MongoDB с записями 1039944

Записи определяются как:

{
    first_name: String,
    last_name: String,
    email: String,
    phone: String,
    company: String,
    owner: BSON::ObjectId
 }

С произвольно сгенерированными значениями для всех полей.

Поле Owner имеет индекс.

Выполнение запросов со следующими условиями:

conditions = {"owner" => { "$in" => id_list }}
opts = {skip: rand, limit: 100}

Результаты:

    # 10201 ids
    #              user     system      total        real
    # 0:       0.240000   0.000000   0.240000 (  0.265148)
    # 1:       0.240000   0.010000   0.250000 (  0.265757)
    # 2:       0.240000   0.000000   0.240000 (  0.267149)
    # 3:       0.240000   0.000000   0.240000 (  0.269981)
    # 4:       0.240000   0.000000   0.240000 (  0.270436)
    # Find:    0.240000   0.000000   0.240000 (  0.266709)


    # 5201 ids
    #              user     system      total        real
    # 0:       0.120000   0.000000   0.120000 (  0.133824)
    # 1:       0.120000   0.000000   0.120000 (  0.134787)
    # 2:       0.110000   0.000000   0.110000 (  0.133262)
    # 3:       0.110000   0.000000   0.110000 (  0.136046)
    # 4:       0.120000   0.000000   0.120000 (  0.141220)
    # Find:    0.130000   0.000000   0.130000 (  0.139110)

    # 201 ids
    #              user     system      total        real
    # 0:       0.010000   0.000000   0.010000 (  0.006044)
    # 1:       0.000000   0.000000   0.000000 (  0.004681)
    # 2:       0.010000   0.000000   0.010000 (  0.004578)
    # 3:       0.000000   0.000000   0.000000 (  0.007048)
    # 4:       0.010000   0.000000   0.010000 (  0.008487)
    # Find:    0.000000   0.000000   0.000000 (  0.005990)

    # 1 id (NOT using IN)
    #              user     system      total        real
    # 0:       0.000000   0.000000   0.000000 (  0.002868)
    # 1:       0.000000   0.000000   0.000000 (  0.004937)
    # 2:       0.010000   0.000000   0.010000 (  0.003151)
    # 3:       0.000000   0.000000   0.000000 (  0.002983)
    # 4:       0.000000   0.000000   0.000000 (  0.003313)
    # Find:    0.000000   0.000000   0.000000 (  0.002742)

Даже со списком идентификаторов 10k в запросе производительность довольно быстро.

Ответ 1

Если вы пытаетесь "выбрать" записи из MongoDB на основе "столбца", имеющего значение из набора возможных значений, для которого вам понадобится объединение с таблицей управления пользователями, то NoSQL работает против вас...

Если список идентификаторов пользователей по-прежнему управляем, вы можете сделать запрос типа where ownerId in (?,?,?,?,?...) (после определения первого списка):

db.documents.find({owner:{$in: [1234, 2345, 4444, 77777, 99999]}})

Способ NoSQL, вероятно, должен денормализовать вещи, например, включив в документ не только ownerId, но и полный путь к иерархии управления:

{  _id: 'the document A',
   owner : 1234,
   managers: [ 2345, 4444, 77777, 99999 ]
}

Конечно, это нужно будет обновить, когда иерархия пользователя будет перемещена.