Я использую пакет R ff
, и у меня есть некоторые объекты ffdf
(размеры около 1.5M x 80), с которыми мне нужно работать. У меня возникают проблемы с тем, что я использую эффективные операции нарезки/нарезки.
Например, у меня есть два целых столбца с именем "YEAR" и "AGE", и я хочу создать таблицу AGE, когда YEAR - 2005.
Один из подходов заключается в следующем:
ffwhich <- function(x, expr) {
b <- bit(nrow(x))
for(i in chunk(x)) b[i] <- eval(substitute(expr), x[i,])
b
}
bw <- ffwhich(a.fdf, YEAR==1999)
answer <- table(a.fdf[bw, "AGE"])
Операция table()
выполняется быстро, но создание битового вектора происходит довольно медленно. У кого-нибудь есть рекомендации для этого лучше?