Я обучил doc2vec и соответствующий word2vec на своем собственном корпусе с помощью gensim. Я хочу визуализировать word2vec, используя t-sne со словами. Как и в, каждая точка на рисунке имеет "слово" также и с ней.
Я рассмотрел аналогичный вопрос: t-sne on word2vec
После этого у меня есть этот код:
import gensim import gensim.models как g
from sklearn.manifold import TSNE
import re
import matplotlib.pyplot as plt
modelPath="/Users/tarun/Desktop/PE/doc2vec/model3_100_newCorpus60_1min_6window_100trainEpoch.bin"
model = g.Doc2Vec.load(modelPath)
X = model[model.wv.vocab]
print len(X)
print X[0]
tsne = TSNE(n_components=2)
X_tsne = tsne.fit_transform(X[:1000,:])
plt.scatter(X_tsne[:, 0], X_tsne[:, 1])
plt.show()
Это дает фигуру с точками, но без слов. То есть я не знаю, какая точка является представителем какого слова. Как я могу отобразить слово с точкой?