Есть ли пакет, содержащий функцию подсчета расстояния Левенштейна, которая реализована как код C или Fortran? У меня есть много строк для сравнения, а stringMatch от MiscPsycho слишком медленно для этого.
Быстрое расстояние Левенштейна в R?
Ответ 1
levenshteinDist (из пакета RecordLinkage) вызывает скомпилированный код C. Попробуйте.
Ответ 2
И stringdist в пакете stringdist делает это, даже быстрее, чем levenshteinDist при определенных условиях (1)
Ответ 3
Вы также можете попробовать stringDist из Biostrings