У меня есть набор для обучения размером 38 МБ (12 атрибутов с 420000 строк). Я использую снимок R
для обучения модели с помощью randomForest
. Это занимает несколько часов для меня.
rf.model <- randomForest(
Weekly_Sales~.,
data=newdata,
keep.forest=TRUE,
importance=TRUE,
ntree=200,
do.trace=TRUE,
na.action=na.roughfix
)
Я думаю, из-за na.roughfix
для выполнения требуется много времени. В учебном наборе есть так много NA's
.
Может ли кто-нибудь дать мне знать, как я могу улучшить производительность?
Моя конфигурация системы:
Intel(R) Core i7 CPU @ 2.90 GHz
RAM - 8 GB
HDD - 500 GB
64 bit OS