Как я могу использовать пакет R randomForest
с весами наблюдения? Я знаю, что такого варианта в этом пакете нет. У меня есть 2 вопроса:
-
Есть ли какие-либо решения этой проблемы с помощью пакета
randomForest
? В этот момент я рисую образцы из данных с весами как вероятность, поэтому я могу хотя бы имитировать ее:m = dim(data)[1] sample(data, m, replace=TRUE, prob=weights)
В нем работают другие (лучшие) решения?
-
Есть ли альтернативы пакету
randomForest
. Я нашел пакетparty
(cforest), но это ужасно с точки зрения управления памятью (или я не могу использовать его так, как я использую пакетrandomForest
). У меня около 200 тыс. Наблюдений и 30-40 переменных.
EDIT:
Извините, что не уточнил детали. Я использую пакет randomForest
для проблемы регрессии (не классификация). Это временный ряд, и каждое наблюдение имеет свой вес. Позже этот вес используется для определения производительности модели во время тестовых наблюдений. Переменная y непрерывна.