Я запускаю случайный лес в наборе данных с 8 числовыми столбцами (предикторами) и 1 фактором (результатом). В наборе данных имеется 1,2 М строк. Когда я это сделаю:
randomForest(outcome.f ~ a + b + c + d + e + f + g + h,data=mdata))
, я получаю сообщение об ошибке:
"Error in randomForest.default(m, y, ...) :
long vectors (argument 26) are not supported in .Fortran"
Есть ли способ предотвратить это? Я не понимаю, почему пакет (по-видимому) пытается выделить вектор длины 2 ^ 31-1. Я использую Mac OS X 10.9.2 с Intel Core i7 (в случае, если это имеет значение для архитектуры).
Информация о сеансе
R version 3.1.0 (2014-04-10)
Platform: x86_64-apple-darwin13.1.0 (64-bit)
locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] randomForest_4.6-7
loaded via a namespace (and not attached):
[1] tools_3.1.0