Вопрос в том, как заполнить NaN наиболее частыми уровнями для столбца категории в pandas dataframe?
В пакете R RandomForest есть
na.roughfix: A completed data matrix or data frame. For numeric variables, NAs are replaced with column medians. For factor variables, NAs are replaced with the most frequent levels (breaking ties at random). If object contains no NAs, it is returned unaltered.
в pandas для числовых переменных я могу заполнить значения NaN с помощью
df = df.fillna(df.median())