Я хотел бы научиться контролировать.
До сих пор я знаю, что нужно следить за всеми функциями.
Однако я хотел бы также провести эксперимент с лучшими функциями K.
Я прочитал документацию и нашел, что в Scikit вы узнаете, что есть метод SelectKBest.
К сожалению, я не уверен, как создать новый фреймворк после поиска этих лучших функций:
Предположим, что я хотел бы провести эксперимент с 5 лучшими функциями:
from sklearn.feature_selection import SelectKBest, f_classif
select_k_best_classifier = SelectKBest(score_func=f_classif, k=5).fit_transform(features_dataframe, targeted_class)
Теперь, если бы я добавил следующую строку:
dataframe = pd.DataFrame(select_k_best_classifier)
Я получаю новый фрейм данных без имен функций (только индекс, начинающийся с 0 до 4).
Я должен заменить его на:
dataframe = pd.DataFrame(fit_transofrmed_features, columns=features_names)
Мой вопрос в том, как создать список features_names
Я знаю, что я должен использовать: select_k_best_classifier.get_support()
Возвращает массив логических значений.
Истинное значение в массиве представляет индекс в правом столбце.
Как я должен использовать этот логический массив с массивом всех имен функций, которые я могу получить с помощью метода:
feature_names = list(features_dataframe.columns.values)