Я попытался использовать машинное обучение для прогнозирования на основе данных временных рядов. В одном из вопросов stackoverflow (createTimeSlices в пакете CARET в R) приведен пример использования createTimeSlices для перекрестной проверки для обучения модели и настройки параметров:
library(caret)
library(ggplot2)
library(pls)
data(economics)
myTimeControl <- trainControl(method = "timeslice",
initialWindow = 36,
horizon = 12,
fixedWindow = TRUE)
plsFitTime <- train(unemploy ~ pce + pop + psavert,
data = economics,
method = "pls",
preProc = c("center", "scale"),
trControl = myTimeControl)
Мое понимание:
- Мне нужно разделить данные на тренировку и тестовый набор.
- Используйте набор тренировок для настройки параметров.
- Оценить полученную модель на тестовом наборе (используя R2, RMSE и т.д.)
Поскольку мои данные являются временными рядами, я полагаю, что я не могу использовать bootstraping для разделения данных на обучение и набор тестов. Итак, мои вопросы: я прав? И если так - Как использовать createTimeSlices для оценки модели?