Я пытаюсь использовать инструмент tesseract ocr для извлечения ocr-текста из видеоигр (я предварительно обрабатываю скриншоты и передаю их в вывод tsv инструмента командной строки и анализируя это).
Я бы хотел использовать его для автоматизации тестирования, в отличие от веб-тестирования селена. То есть я хотел бы иметь возможность ждать появления элементов вместо сна и нажатия на кнопки (в основном меню).
Чтобы быть в состоянии сделать это, мне нужно иметь возможность последовательно находить один и тот же текст кнопки и находить как можно больше текста против целого ряда видеоигр. Для абстракции я предпочел бы, чтобы параметры предварительной обработки /tesseract были одинаковыми для каждой игры.
Возможно, я могу добавить словарь каждого слова, встречающегося в каждой игре, но я бы предпочел не делать этого.
У меня есть настройка, где я могу протестировать несколько различных комбинаций опций предварительной обработки /tesseract и увидеть полученные слова.
Я уже попробовал взорвать скриншот (который 70-90 точек на дюйм) в 5 раз и сделать его серого, прежде чем передать его в tesarect.
Какие еще методы я могу использовать для улучшения числа и точности моих результатов? На какие ручки tesseract я должен смотреть? Есть ли другая полезная предварительная обработка, которую я могу добавить?
PS Я нахожу, что если я увеличу изображение вдвое длиннее/широко, то tesseract взрывается, похоже, потому что у него заканчивается память для изображения. Есть ли статический предел? Могу ли я найти его, чтобы я мог взорвать изображение около максимального размера? Могу ли я его отрегулировать?