Я ищу библиотеку/класс, которая позволяет осуществлять интеллектуальное сравнение двух строк. В лучшем случае это даст в результате процент того, как две строки одинаковы. Я сравниваю названия компаний, адреса, которые записываются в разные хранилища, таким образом, имея много ошибок или несоответствий в именах.
Примеры строк для сравнения:
"Good Company Ltd." vs. "GoodCompany"
"Baker Street 2" vs. "Baker Str. 2"
Если я получаю результат в процентах от alikeness, то это может быть вход для интеллектуального слияния таких данных.
Знаете ли вы хорошие библиотеки, которые позволяли бы сравнивать такие умные строки?