Для моего приложения я хотел бы, с учетом текста, определить его язык (например, код ISO и шанс). Я хотел бы знать, есть ли какой-либо веб-сервис или java-библиотека для этого.
Заранее спасибо
Ответ 1
Автоматическое обнаружение естественного языка текста относительно легко с использованием алгоритма анализа bigram. Вы можете либо реализовать его самостоятельно, либо просто использовать некоторую существующую библиотеку, например. Language-Detection проект.
Google Translate, который устарел, был заменен на Google Translate v2 API, который теперь является платной услугой ($ 20/1M chars). (слово на улице - это то, что бесплатный сервис был отменен из-за того, что оптимизаторы SEO использовали его для установки поддельных сайтов).