Реализация Java OCR

Это в первую очередь просто любопытство, но существуют ли какие-либо реализации OCR в чистой Java? Мне любопытно, как это будет выполняться исключительно на Java, и OCR в целом меня интересует, поэтому я хотел бы увидеть, как это реализовано на языке, который я полностью понимаю. Естественно, для этого потребуется, чтобы реализация была с открытым исходным кодом, но меня все еще интересуют проприетарные решения, поскольку я мог бы хотя бы проверить производительность в этом случае.

Я видел пару, которая может использоваться на Java (например, Asprise), но, похоже, это не чисто Реализации Java... есть ли какие-либо?

Ответ 1

Я рекомендую попробовать проект Java OCR на sourceforge.net. Я изначально разработал его, и у меня запись в блоге.

Поскольку я положил его на sourceforge, его функциональность была расширена и улучшилась совсем немного благодаря большой работе волонтерского исследователя/разработчика.

Попробуйте, и если вам это не нравится, вы всегда можете его улучшить!

Ответ 2

Мы протестировали несколько движков OCR с Java, такими как Tesseract, Asprise, Abbyy и т.д. В нашем анализе Abbyy дал наилучшие результаты.

Ответ 3

Если вы ищете очень расширяемый вариант или имеете конкретный проблемный домен, вы можете подумать о том, чтобы свернуть его, используя Java Object Oriented Neural Engine. Еще одна ссылка JOONE.

Я успешно использовал его в личном проекте для идентификации буквы с изображения, такого как this, вы можете найти все источники для OCR-компонент моего приложения на github, здесь.

Ответ 4

Там есть множество библиотек OCR. Тем не менее, мой опыт заключается в том, что основные коммерческие реализации, ABBYY, Omnipage и ReadIris, намного превосходят реализацию с открытым исходным кодом или другие второстепенные реализации. Эти коммерческие библиотеки не предназначены в первую очередь для работы с Java, хотя, конечно, это возможно.

Конечно, если вы заинтересованы в изучении кода, реализация с открытым исходным кодом будет делать трюк.

Ответ 5

Просто нашел этот (не знаю, не тестировался, проверьте себя)

Ron Cemer Java OCR


Поскольку вам это нужно только для любопытства, вы можете заглянуть в источник этого апплета.

Это OCR рукописных символов с нейронной сетью

Java OCR: Распознавание рукописного ввода