У меня есть куча data.tables в списке. Я хочу применить unique()
к каждой таблице данных в моем списке, но при этом уничтожаются все мои ключи data.table.
Вот пример:
A <- data.table(a = rep(c("a","b"), each = 3), b = runif(6), key = "a")
B <- data.table(x = runif(6), b = runif(6), key = "x")
blah <- unique(A)
Здесь blah
все еще есть ключ, и все правильно в мире:
key(blah)
# [1] "a"
Но если я добавлю данные data.tables в список и использую lapply()
, ключи будут уничтожены:
dt.list <- list(A, B)
unique.list <- lapply(dt.list, unique) # Keys destroyed here
lapply(unique.list, key)
# [[1]]
# NULL
# [[2]]
# NULL
Это, вероятно, связано с тем, что я не понимаю, что это означает для ключей, которые будут назначены "по ссылке", поскольку у меня были другие проблемы с исчезновением ключей.
Итак:
- Почему lapply не сохраняет мои ключи?
- Что значит сказать, что клавиши назначаются "по ссылке"?
- Должен ли я даже хранить данные в списке?
- Как я могу безопасно хранить/манипулировать data.tables, не опасаясь потерять ключи?
EDIT:
Для чего это стоит, ужасный цикл for
тоже работает отлично:
unique.list <- list()
for (i in 1:length(dt.list)) {
unique.list[[i]] <- unique(dt.list[[i]])
}
lapply(unique.list, key)
# [[1]]
# [1] "a"
# [[2]]
# [1] "x"
Но это R, а for
петли - злые.