Поиск вложенного поля для нескольких значений в одном поле с elasticsearch

Я пытаюсь запросить вложенные свойства с несколькими значениями.

Вот пример, который будет более ясным.

Создать индекс с вложенным полем

    curl -X DELETE "http://localhost:9200/testing_nested_query/"
    curl -X POST "http://localhost:9200/testing_nested_query/" -d '{
        "mappings": {
            "class": {
              properties: {
                title: {"type": "string"},
                "students": {
                  "type": "nested",
                  "properties": {
                    "name": {"type": "string"}
                  }
                }
              }
            }
        }

    }'

Добавить несколько значений

    curl -XPUT 'http://localhost:9200/testing_nested_query/class/1' -d '{
      "title": "class1",
      "students": [{"name": "john"},{"name": "jack"},{"name": "jim"}]
    }'

    curl -XPUT 'http://localhost:9200/testing_nested_query/class/2' -d '{
      "title": "class2",
      "students": [{"name": "john"},{"name": "chris"},{"name": "alex"}]
    }'

Запрос для всех классов, где john (2 удачных, как ожидалось)

curl -XGET 'http://localhost:9200/testing_nested_query/class/_search' -d '{
  "query": {
    "nested": {
      "path":"students",
      "query": {
        "bool": {
          "must": [
            {"match": {"students.name": "john"}}
          ]
        }
      }
    }
  }
}'

Запрос для классов, в которых участвуют как john, так и jack (0 результатов вместо 1)

curl -XGET 'http://localhost:9200/testing_nested_query/class/_search' -d '{
  "query": {
    "nested": {
      "path":"students",
      "query": {
        "bool": {
          "must": [
            {"match": {"students.name": "john"}},
            {"match": {"students.name": "jack"}}
          ]
        }
      }
    }
  }
}'

Я пробовал с совпадением и фильтром, но я никогда не могу получить запрос для возврата ожидаемых значений.

Ответ 1

Просто нужно немного изменить:

{
  "query": {
    "bool": {
        "must": [
           {
               "nested": {
                  "path":"students",
                  "query": {
                    "bool": {
                      "must": [
                        {"match": {"name": "john"}}
                      ]
                    }
                  }
                }
           },
           {
               "nested": {
                  "path":"students",
                  "query": {
                    "bool": {
                      "must": [
                        {"match": {"name": "jack"}}
                      ]
                    }
                  }
                }
           }
        ]
    }
  }
}

Почему?

В принципе, во вложенном запросе запрос и фильтр совместно выполняются на одном вложенном документе - в вашем случае одно имя. Таким образом, ваш запрос будет забирать каждый вложенный документ и попытаться найти каждый документ с name равным john и jack в то же время - это невозможно.

Мой запрос пытается найти индексированный документ с одним вложенным документом с name равным john и другим вложенным документом с name равным jack. Таким образом, в основном один вложенный запрос пытается полностью сопоставить один вложенный документ.

Чтобы доказать, что я предлагаю, попробуйте следующее:

Создайте тот же индекс с тем же отображением, что и вы

** Затем проиндексируйте следующие документы **

curl -XPUT 'http://localhost:9200/testing_nested_query/class/1' -d '{
      "title": "class1",
      "students": [{"name": "john", "age": 4},{"name": "jack", "age": 1},{"name": "jim", "age": 9}]
    }'

curl -XPUT 'http://localhost:9200/testing_nested_query/class/2' -d '{
      "title": "class1",
      "students": [{"name": "john", "age": 5},{"name": "jack", "age": 4},{"name": "jim", "age": 9}]
    }'

Теперь выполните следующие запросы:

{
  "query": {
       "nested": {
          "path":"students",
          "query": {
            "bool": {
              "must": [
                {"match": {"name": "john"}},
                {"match": {"age": 4}}
              ]
            }
          }
        }
  }
}

Согласно вашим ожиданиям, это должно соответствовать 2 документам, но на самом деле оно соответствует только одному. Поскольку существует только один вложенный документ, который имеет как name, равный john, так и age, равный 4.

Надеюсь, что это поможет.

Ответ 2

Вы также можете сделать следующий путь. где вам не нужно снова повторять bool во вложенном блоке, так как в этом блоке есть только один, вы можете просто совместить совпадение без bool

{
  "query": {
    "bool": {
      "must": [{
        "nested": {
          "path": "students",
          "query": {
            {
              "term": {
                "name": "john"
              }
            }
          }
        }
      }, {
        "nested": {
          "path": "students",
          "query": {
            {
              "term": {
                "name": "jack"
              }
            }
          }
        }
      }]
    }
  }
}