Итак, что я услышал после исследования, так это то, что единственными вариантами OCR являются либо Tesseract, либо CuneiForm.
Теперь документы Tesseract просто ужасны, все, что они вам дают, это набор кода Visual Studio (для меня в Windows), и оттуда вы сами по себе в океане их API. Все, что вы можете сделать, это использовать exe, который компилирует, а затем использовать его на образе TIFF.
Я ожидал, по крайней мере, короткую документацию, которая расскажет вам, как заставить их API-вызов использовать OCR хотя бы для небольшого примера, но нет, в их документах нет ничего подобного.
CuneiForm: я его скачал и "отлично" все по русски.: (
Неужели этим парням трудно привести небольшой пример, вместо этого они предоставляют нам кучу не относящейся к делу информации, которую, вероятно, не получат 90% людей, как вы можете туда добраться, не начиная с мелочей, и они ничего не объясняют!
Так что у меня есть куча API, но как, черт возьми, я должен его использовать, если он нигде не объясняется?... Может быть, кто-то может предложить мне совет и решение? Я не прошу чуда, просто что-то маленькое, чтобы показать мне, как все работает.