Можем ли мы использовать Yolo для обнаружения и распознавания текста в изображении

В настоящее время я использую глубокую левую модель, которая называется "Yolov2" для обнаружения объекта, и я хочу использовать ее для извлечения текста и использования, чтобы сохранить его на диске, но я не знаю, как это сделать, если кто-либо узнайте больше об этом, пожалуйста, посоветуйте мне

Я использую Tensorflow

Спасибо

Ответ 1

Если вы используете предварительно обученную модель, вам необходимо сохранить эти выходные данные и ввести изображения в сеть распознавания символов, если используется нейронная сеть или другой подход.

То, что вы делаете, это "распознавание текста сцены". Вы можете проверить чтение текста в дикой природе с помощью сверточных нейронных сетей , бумага, здесь демо и домашняя страница. У пользователя Github chongyangtao есть целый список ресурсов по теме.

Ответ 2

У меня есть аналогичный вопрос, и я делаю модель обнаружения цифр с помощью набора данных svhn. Это еще не законченный проект, но он работает хорошо. Вы можете увидеть код Yolo-digit-detector.