Мне интересно использовать OCR, чтобы извлекать жирные и курсивные слова из простого текста. Например, если я вставляю четкое изображение с таким текстом:
"Быстрая коричневая лиса прыгает над ленивой собакой."
Я хотел бы получить такой вывод: полужирный ( "коричневый", "прыжки" ), курсив ( "ленивый" )
Я изучил это с помощью OCRopus или Tesseract, но документация плохая, и я не могу сказать, возможно ли это, или как это сделать, если это возможно.