Пользовательский словарь для Tesseract

В настоящее время я работаю над проектом для Android с использованием Tesseract OCR. Я надеялся точно настроить результаты, предоставленные пользователю, добавив словарь. Согласно http://code.google.com/p/tesseract-ocr/wiki/FAQ, лучший способ сделать это -

Замените слова tessdata/eng.user своим списком слов, в том же формат - текст UTF8, по одному слову в строке.

Однако в папке tessdata нет файла eng.user-words, я предполагаю, что если я просто сделаю текстовый файл с моим словарем в нем, он никогда не будет использоваться.

Имеет ли кто-нибудь подобный опыт и знает, что делать? Любой совет будет большой помощью.

Ответ 1