У меня есть куча PDF-документов с табличными данными в них, которые мне нужно извлечь в более читаемый формат для хранения в электронной таблице, базе данных или что-то еще.
Есть ли что-нибудь в мире (желательно бесплатно), которое может получать табличные данные из PDF файлов в более читаемый формат в массе, либо встроенный в приложение, либо пассивно через командную строку или цикл цикла в коде (.net)?
Может быть любой формат на самом деле (doc, html) до тех пор, пока поддерживаются таблицы.
Все, что я нашел до сих пор, является одноразовым (только один документ за раз, у меня сотни, чего не происходит) или не поддерживает структуру таблицы.
Любые идеи, пожалуйста, публикуйте.