Я хочу сделать программу, которая принимает изображение в качестве ввода и выводит текст. Теперь я знаю, что я могу использовать нейронную сеть, чтобы превратить образ одного символа в этот символ. Трудная часть: учитывая изображение с текстом в нем, как бы я создавал все прямоугольники вокруг каждого отдельного символа?
Итак, какие методы используются для этого, и кто-нибудь знает какие-либо исследовательские документы, которые обсуждают, как это сделать? Спасибо вам