Я пытаюсь найти какой-то хороший, нечеткий алгоритм сопоставления строк. Прямое сопоставление не работает для меня - это не слишком хорошо, потому что, если мои строки не похожи на 100%, совпадение не удастся. Метод Левенштейна не очень хорошо работает со строками, так как работает на уровне символов. Я искал что-то вроде соответствия уровня слов, например
Строка A: быстрая коричневая лиса.
Строка B: Быстрая коричневая лиса перепрыгнула через ленивую собаку.
Они должны совпадать, так как все слова в строке A находятся в строке B.
Теперь это упрощенный пример, но кто-нибудь знает хороший, нечеткий алгоритм сопоставления строк, который работает на уровне слов.