Я знаком с использованием функций BOW для классификации текста, где мы сначала находим размер словаря для корпуса, который становится размером нашего вектор-функции. Для каждого предложения/документа и для всех его составляющих слов мы тогда ставим 0/1 в зависимости от отсутствия/наличия этого слова в этом предложении/документе.
Однако теперь, когда я пытаюсь использовать векторное представление каждого слова, создается глобальный словарь?