Я установил CountVectorizer
для некоторых документов в scikit-learn
. Я хотел бы видеть все термины и их соответствующую частоту в текстовом корпусе, чтобы выбрать стоп-слова. Например
'and' 123 times, 'to' 100 times, 'for' 90 times, ... and so on
Есть ли встроенная функция для этого?