Распознавание языков в Java

Есть ли какой-либо язык с открытым исходным кодом для Java? Найдено только для c/С++.

UPD:

Я говорю о человеческом текстовом языке. Пример:

Вход: Меня зовут Джон. Выход: английский.

Вход: Ich heisse John. Выход: немецкий.

Вход: Меня зовут Джон. Результат: русский.

Ответ 1

Посмотрите, что вы думаете о версии в Apache Tika. Это предполагает, что вы хотите узнать, на каком языке текста, в отличие от желания создать парсер для языка программирования.

Ответ 2

Textcat http://textcat.sourceforge.net/ не России, но это не обрабатывать следующее:

  • албанский
  • датский
  • нидерландский
  • английский
  • финский
  • французский
  • немецкий
  • венгерский
  • итальянский
  • норвежском
  • польский
  • словацкий
  • Словенская
  • испанский
  • Swedish

Ответ 3

Я думаю, ANTLR в значительной степени стандартный.

Ответ 4

Существует API обнаружения языков, который принимает текст через HTTP POST и возвращает JSON с обнаруженными языками и оценками. Он может использоваться с Java или любым другим языком программирования.