Мне сказали использовать пакет caret, чтобы выполнить регрессию Support Vector Machine с 10-кратной проверкой перекрестных ссылок на набор данных, который у меня есть. Я рисую свою переменную ответа на 151 переменную. Я сделал следующее: -
> ctrl <- trainControl(method = "repeatedcv", repeats = 10)
> set.seed(1500)
> mod <- train(RT..seconds.~., data=cadets, method = "svmLinear", trControl = ctrl)
в котором я получил
C RMSE Rsquared RMSE SD Rsquared SD
0.2 50 0.8 20 0.1
0.5 60 0.7 20 0.2
1 60 0.7 20 0.2
Но я хочу иметь возможность взглянуть на мои складки, и для каждого из них, насколько близки предсказанные значения к фактическим значениям. Как я смотрю на это?
Кроме того, в нем говорится, что: -
RMSE was used to select the optimal model using the smallest value.
The final value used for the model was C = 0.
Мне просто интересно, что это значит и что означает C в таблице выше?
RT (seconds) 76_TI2 114_DECC 120_Lop 212_PCD 236_X3Av
38 4.086 1.2 2.322 0 0.195
40 2.732 0.815 1.837 1.113 0.13
41 4.049 1.153 2.117 2.354 0.094
41 4.049 1.153 2.117 3.838 0.117
42 4.56 1.224 2.128 2.38 0.246
42 2.96 0.909 1.686 0.972 0.138
42 3.237 0.96 1.922 1.202 0.143
44 2.989 0.8 1.761 2.034 0.11
44 1.993 0.5 1.5 0 0.102
44 2.957 0.8 1.761 0.988 0.141
44 2.597 0.889 1.888 1.916 0.114
44 2.428 0.691 1.436 1.848 0.089
Это снайпер моего набора данных. Я пытаюсь использовать RT секунд против 151 переменных.
Спасибо