У меня есть изображение счета, и я хочу обнаружить текст на нем. Поэтому я планирую использовать 2 шага: сначала нужно определить текстовые области, а затем использовать OCR для распознавания текста.
Я использую OpenCV 3.0 для python. Я могу идентифицировать текст (включая некоторые нетекстовые области), но я также хочу идентифицировать текстовые поля из изображения (также исключая нетекстовые области).
Мое входное изображение: , а вывод: и для этого я использую код ниже:
img = cv2.imread('/home/mis/Text_Recognition/bill.jpg')
mser = cv2.MSER_create()
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #Converting to GrayScale
gray_img = img.copy()
regions = mser.detectRegions(gray, None)
hulls = [cv2.convexHull(p.reshape(-1, 1, 2)) for p in regions]
cv2.polylines(gray_img, hulls, 1, (0, 0, 255), 2)
cv2.imwrite('/home/mis/Text_Recognition/amit.jpg', gray_img) #Saving
Теперь я хочу идентифицировать текстовые поля и удалять/не идентифицировать любые нетекстовые области в счете-фактуре. Я новичок в OpenCV и новичок в Python. Я могу найти несколько примеров из пример MATAB и пример С++, но если я конвертируйте их в python, это займет много времени для меня.
Есть ли какой-нибудь пример с python с использованием OpenCV, или кто-нибудь может мне помочь?