При построении каждого дерева в случайном лесу с использованием загрузочных выборок для каждого терминала node мы выбираем m переменных случайным образом из p-переменных, чтобы найти лучший раскол (p - общее количество функций в ваших данных). Мои вопросы (для RandomForestRegressor):
1) Что соответствует max_features (m или p или что-то еще)?
2) Являются ли переменные m произвольно выбранными из переменных max_features (каково значение m)?
3) Если max_features соответствует m, то зачем мне устанавливать его равным p для регрессии (по умолчанию)? Где случайность с этой настройкой (т.е. Как она отличается от мешков)?
Спасибо.