Я пытаюсь извлечь цифры из типичного табло, которое вы найдете в спортзале средней школы. У меня есть каждый номер в цифровом шрифте "будильник", и ему удалось проецировать правильную, пороговую и извлечь определенную цифру из видеопотока.
Здесь образец ввода моего шаблона
Моя проблема заключается в том, что ни один метод классификации не будет точно определять все цифры 0-9. Я пробовал несколько методов
1) Tesseract OCR - этот последовательно разваливается на 4 и часто возвращает странные результаты. Просто используйте версию командной строки. Если я на самом деле пытаюсь обучить его шрифту "будильник", я получаю неизвестный символ каждый раз.
2) kNearest с OpenCV - я ищу базу данных, состоящую из моих шаблонных изображений (0-9) и посмотрю, какая из них ближайшая. Я часто путаюсь между 3/1 и 7/1
3) cvMatchShapes - это довольно плохо, обычно он не может определить разницу между двумя цифрами для каждой цифры ввода
4) Касательное расстояние - это самое близкое, но наименьшее касательное расстояние между входом и моими шаблонами заканчивается отображением "7" на "1" каждый раз
Мне очень сложно получить алгоритм классификации для такой простой проблемы. Я чувствую, что я правильно очистил вход, и это довольно простой случай для классификации, но я не могу получить что-либо достаточно надежное, чтобы фактически использовать его на практике. Любые идеи о том, где искать алгоритмы классификации или как правильно их использовать, будут оценены. Я не убираю вход? Как насчет лучшей базы данных ввода? Я не знаю, что еще я буду использовать для ввода, каждая цифра и шаблон смотрят на это место.