Autodetect язык текста в Java (Android)

Для моего приложения я хотел бы, с учетом текста, определить его язык (например, код ISO и шанс). Я хотел бы знать, есть ли какой-либо веб-сервис или java-библиотека для этого.

Заранее спасибо

Ответ 1

Автоматическое обнаружение естественного языка текста относительно легко с использованием алгоритма анализа bigram. Вы можете либо реализовать его самостоятельно, либо просто использовать некоторую существующую библиотеку, например. Language-Detection проект.

Ответ 4

Google Translate, который устарел, был заменен на Google Translate v2 API, который теперь является платной услугой ($ 20/1M chars). (слово на улице - это то, что бесплатный сервис был отменен из-за того, что оптимизаторы SEO использовали его для установки поддельных сайтов).

Ответ 5

Мое решение проблемы обнаружения языка на Android доступно в Интернете.

Он адаптирует существующую систему определения языка Java на основе n-граммов для ускорения работы с использованием жестко запрограммированных языковых профилей вместо загрузки профилей из JSON текстовые файлы.