Я пытаюсь получить все похожие звучащие слова из списка.
Я пытался получить их, используя косинусное сходство, но это не соответствует моей цели.
from sklearn.metrics.pairwise import cosine_similarity
dataList = ['two','fourth','forth','dessert','to','desert']
cosine_similarity(dataList)
Я знаю, что это неправильный подход, я не могу получить такой результат, как:
result = ['xx', 'xx', 'yy', 'yy', 'zz', 'zz']
где они означают, что слова, которые звучат похоже