Я потратил всю неделю на это, так что это немного град Мэри.
Я пытаюсь упаковать Tesseract OCR в AWS Lambda, работающий на Python (я также использую PILLOW для предварительной обработки изображения, следовательно, выбор Python).
Я понимаю, как развернуть пакеты Python на AWS с помощью virtualenv, однако я не могу найти способ развертывания реального OCR Tesseract в среде (например,/env/)
- Выполнение
pip install py-tesseract
приводит к успешному развертыванию оболочки python в /env/, однако это зависит от отдельной (локальной) установки Tesseract - Выполнение
pip install tesseract-ocr
дает мне только определенное расстояние, прежде чем он выйдет из строя, как следует из того, что я предполагаю, из-за отсутствия зависимости от leptonica. Тем не менее, я не знаю, как упаковать leptonica в/env/(если это возможно)
tesseract_ocr.cpp:264:10: fatal error: 'leptonica/allheaders.h' file not found #include "leptonica/allheaders.h"
- Загрузка файла 0.9.1 python-tesseract из файла https://bitbucket.org/3togo/python-tesseract/downloads и делает easy_install также ошибки при поиске зависимостей
Processing dependencies for python-tesseract==0.9.1 Searching for python-tesseract==0.9.1 Reading https://pypi.python.org/simple/python-tesseract/ Couldn't find index page for 'python-tesseract' (maybe misspelled?) Scanning index of all packages (this may take a while) Reading https://pypi.python.org/simple/ No local packages or download links found for python-tesseract==0.9.1
Любые указатели будут очень благодарны.