Мне нужно создать классификатор для текста, и теперь я использую TfidfVectorizer и SelectKBest для выбора функций, как показано ниже:
vectorizer = TfidfVectorizer(sublinear_tf = True, max_df = 0.5, stop_words = 'english',charset_error='strict')
X_train_features = vectorizer.fit_transform(data_train.data)
y_train_labels = data_train.target;
ch2 = SelectKBest(chi2, k = 1000)
X_train_features = ch2.fit_transform(X_train_features, y_train_labels)
Я хочу распечатать выбранные имена функций (текст) после выбора k лучших функций, есть ли способ сделать это? Мне просто нужно распечатать выбранные имена функций, возможно, я должен использовать CountVectorizer?