Я пытаюсь использовать tesseract-OCR через python-tesseract для чтения шрифта с низким разрешением, который выглядит так:
К сожалению, это изображение возвращает
ZIJZHZI
Я думаю, что разрешение слишком низкое, и это вызывает проблемы. Я пробовал увеличивать изображение и обрезать его до отдельных символов, но ни один из них не обеспечивает значительного улучшения. Есть ли что-нибудь еще, что я должен рассмотреть, желательно что-то, что можно было бы сделать с помощью библиотеки изображений Python? Или я должен просто отказаться от tesseract/train.
Для чего стоит, PIL имеет следующие встроенные фильтры:
BLUR, CONTOUR, DETAIL, EDGE_ENHANCE,
EDGE_ENHANCE_MORE, EMBOSS, FIND_EDGES,
SMOOTH, SMOOTH_MORE и SHARPEN