Я хочу, чтобы иметь возможность конвертировать PDF файлы в CSV файлы и нашел несколько полезных скриптов, но, будучи новым для Python, у меня есть вопрос:
Где вы указываете путь к файлу PDF и CSV, который хотите распечатать?
Я использую Python 2.7.11 и PDFMiner 20140328.
import sys
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.pdfpage import PDFPage
from pdfminer.converter import XMLConverter, HTMLConverter, TextConverter
from pdfminer.layout import LAParams
from cStringIO import StringIO
def pdfparser(data):
    fp = file(data, 'rb')
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    codec = 'utf-8'
    laparams = LAParams()
    device = TextConverter(rsrcmgr, retstr, codec=codec, laparams=laparams)
    interpreter = PDFPageInterpreter(rsrcmgr, device)
    for page in PDFPage.get_pages(fp):
    interpreter.process_page(page)
    data =  retstr.getvalue()
    print data
if __name__ == '__main__':
pdfparser(sys.argv[1]) 
