У меня есть огромный набор данных с 679 строками и 16 столбцами с 30% пропущенных значений. Поэтому я решил оспаривать эти недостающие значения функцией impute.knn из пакета impute, и я получил набор данных с 679 строками и 16 столбцами, но без отсутствующих значений.
Но теперь я хочу проверить точность с помощью RMSE, и я попробовал 2 варианта:
- загрузите пакет
hydroGOFи примените функциюrmse -
sqrt(mean (obs-sim)^2), na.rm=TRUE)
В двух ситуациях у меня есть ошибка: errors in sim .obs: non numeric argument to binary operator.
Это происходит потому, что исходный набор данных содержит значение NA (некоторые значения отсутствуют).
Как я могу вычислить RMSE, если я удалю отсутствующие значения? Тогда obs и sim будут иметь разные размеры.
