Я пытаюсь преобразовать программно PDF в HTML. До сих пор я использовал pdftohtml, но наши пользователи недовольны результатами.
Вот что мне нужно:
-
Я использую Ruby on Rails, но любой инструмент, работающий в Unix, будет работать, поскольку я могу вызвать его из командной строки. Но, конечно, хороший камень или плагин были бы идеальными.
-
Я бы предпочел, чтобы он был с открытым исходным кодом
-
Он должен обрабатывать образы
-
Было бы неплохо, если бы была возможность сбросить изображения, если это необходимо
-
Он должен быть стабильным
-
Ему нужно вернуть html с макетом, близким к оригинальному pdf (я пробовал pdftohtml, и результат не так хорошо во многих случаях)