Word2vec - это инструмент с открытым исходным кодом для вычисления расстояния слов, предоставляемого Google. Его можно использовать, вводя слово и выводя список ранжированных слов в соответствии с подобием. например.
Input:
france
Вывод:
Word Cosine distance
spain 0.678515
belgium 0.665923
netherlands 0.652428
italy 0.633130
switzerland 0.622323
luxembourg 0.610033
portugal 0.577154
russia 0.571507
germany 0.563291
catalonia 0.534176
Однако, мне нужно сделать, чтобы вычислить расстояние подобия, указав 2 слова. Если я дам "france" и "spain", как я могу получить оценку 0.678515, не читая весь список слов, давая просто "france".