Я читал, что наиболее распространенным методом моделирования тем (извлечение возможных тем из текста) является выделение скрытого распределения Дирихле (LDA).
Тем не менее, меня интересует, стоит ли тестировать моделирование темы с помощью Word2Vec, поскольку она кластеризует слова в векторном пространстве. Не могли ли кластеры рассматриваться как темы?
Как вы думаете, имеет смысл следовать этому подходу ради каких-то исследований? В конце меня интересует извлечение ключевых слов из текста в соответствии с темами.