Недавно я наткнулся на Tesseract и OpenCV. Похоже, что Tesseract является полнофункциональным механизмом OCR, а OpenCV можно использовать в качестве основы для создания приложения/службы OCR.
Я попытался использовать Tesseract на некоторых моих изображениях, и его точность кажется приличной. Позже я наткнулся на очень простой учебник по использованию OpenCV для выполнения OCR с использованием Python и был впечатлен. Через несколько минут я закончил тренировку системы, и ее точность была хорошей. Но, конечно, использование этого подхода означает, что мне нужно интенсивно обучать мою систему, используя большой набор тренировок.
Мои конкретные вопросы заключаются в следующем:
- Как выбрать Tesseract и использовать OpenCV для создания пользовательского OCR-приложения?
- Для Tesseract доступны разные обучающие наборы данных для разных языков. Есть ли у OpenCV что-то подобное, так что мне не нужно начинать работу, чтобы добиться OCR?
- Какой из них лучше для коммерческого применения?
Любые предложения?
Примечание: мне 24 часа в области Computer Vision, но я желаю заложить время и усилия, чтобы изучить предварительные условия.