Как вы запрашиваете несуществующий (нулевой) атрибут в DynamoDB

Я пытаюсь запросить таблицу DynamoDB, чтобы найти все элементы, где атрибут email не установлен. Глобальный вторичный индекс, называемый EmailPasswordIndex, существует в таблице, которая включает в себя поле email.

var params = {
    "TableName": "Accounts",
    "IndexName": "EmailPasswordIndex",
    "KeyConditionExpression": "email = NULL",
};

dynamodb.query(params, function(err, data) {
    if (err)
        console.log(JSON.stringify(err, null, 2));
    else
        console.log(JSON.stringify(data, null, 2));
});

Результат:

{
  "message": "Invalid KeyConditionExpression: Attribute name is a reserved keyword; reserved keyword: NULL",
  "code": "ValidationException",
  "time": "2015-12-18T05:33:00.356Z",
  "statusCode": 400,
  "retryable": false
}

Определение таблицы:

var params = {
    "TableName": "Accounts",
    "KeySchema": [
        { "AttributeName": "id", KeyType: "HASH" }, // Randomly generated UUID
    ],
    "AttributeDefinitions": [
        { "AttributeName": "id", AttributeType: "S" },
        { "AttributeName": "email", AttributeType: "S" }, // User e-mail.
        { "AttributeName": "password", AttributeType: "S" }, // Hashed password.
    ],
    "GlobalSecondaryIndexes": [
        {
            "IndexName": "EmailPasswordIndex",
            "ProvisionedThroughput": {
                "ReadCapacityUnits": 1,
                "WriteCapacityUnits": 1
            },
            "KeySchema": [
                { "AttributeName": "email", KeyType: "HASH" },
                { "AttributeName": "password", KeyType: "RANGE" },
            ],
            "Projection": { "ProjectionType": "ALL" }
        },
    ],
    ProvisionedThroughput: {       
        ReadCapacityUnits: 1, 
        WriteCapacityUnits: 1
    }
};

dynamodb.createTable(params, function(err, data) {
    if (err)
        console.log(JSON.stringify(err, null, 2));
    else
        console.log(JSON.stringify(data, null, 2));
});

Ответ 1

Глобальные вторичные индексы DynamoDB позволяют индексам быть разреженными. Это означает, что если у вас есть GSI, чей хэш или ключ диапазона для элемента не определены, этот элемент просто не будет включен в GSI. Это полезно в ряде случаев использования, так как позволяет вам напрямую идентифицировать записи, содержащие определенные поля. Однако этот подход не будет работать, если вы ищете отсутствие поля.

Чтобы получить все элементы, у которых есть поле, не установленное наилучшим образом, можно прибегнуть к сканированию с фильтром. Эта операция будет очень дорогой, но это будет простой код, выглядящий примерно так:

var params = {
    TableName: "Accounts",
    FilterExpression: "attribute_not_exists(email)"
};

dynamodb.scan(params, {
    if (err)
        console.log(JSON.stringify(err, null, 2));
    else
        console.log(JSON.stringify(data, null, 2));
});

Ответ 2

@jaredHatfield корректно, если поле не существует, но оно не будет работать, если подано null. NULL - это ключевое слово и не может использоваться напрямую. Но вы можете использовать его с ExpressionAttributeValues.

const params = {
    TableName: "Accounts",
    FilterExpression: "attribute_not_exists(email) or email = :null",
    ExpressionAttributeValues: {
        ':null': null
    }
}

dynamodb.scan(params, (err, data) => {
    if (err)
        console.log(JSON.stringify(err, null, 2));
    else
        console.log(JSON.stringify(data, null, 2));
})