У меня есть огромный набор данных с 679 строками и 16 столбцами с 30% пропущенных значений. Поэтому я решил оспаривать эти недостающие значения функцией impute.knn из пакета impute, и я получил набор данных с 679 строками и 16 столбцами, но без отсутствующих значений.
Но теперь я хочу проверить точность с помощью RMSE, и я попробовал 2 варианта:
- загрузите пакет
hydroGOF
и примените функциюrmse
-
sqrt(mean (obs-sim)^2), na.rm=TRUE)
В двух ситуациях у меня есть ошибка: errors in sim .obs: non numeric argument to binary operator.
Это происходит потому, что исходный набор данных содержит значение NA
(некоторые значения отсутствуют).
Как я могу вычислить RMSE, если я удалю отсутствующие значения? Тогда obs
и sim
будут иметь разные размеры.