Я хотел бы знать способ удаления белых полей из файла PDF. Как и Adobe Acrobat X Pro. Я понимаю, что это не будет работать с каждым PDF файлом.
Я бы предположил, что способ сделать это - получить поля текста, а затем вырезать из этих полей.
PyPdf является предпочтительным.
iText находит текстовые поля на основе этого кода:
public void addMarginRectangle(String src, String dest)
throws IOException, DocumentException {
PdfReader reader = new PdfReader(src);
PdfReaderContentParser parser = new PdfReaderContentParser(reader);
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(RESULT));
TextMarginFinder finder;
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
finder = parser.processContent(i, new TextMarginFinder());
PdfContentByte cb = stamper.getOverContent(i);
cb.rectangle(finder.getLlx(), finder.getLly(),
finder.getWidth(), finder.getHeight());
cb.stroke();
}
stamper.close();
}