Я вижу много вопросов и ответов об использовании С# для создания PDF файлов.
У меня есть связанная, но другая задача.
У меня есть большое количество файлов PDF, которые уже созданы, и я хотел бы проверить некоторые части содержимого с помощью регулярных выражений (RegExs). Я хочу открыть PDF файлы на С# и уметь читать текст в чем-то приближенном линейном виде.
Если заголовки, нижние колонтитулы, любые боковые панели и т.д. пропускаются или считываются из строя, это не имеет значения. Я просто получаю столько текста основного текста, сколько могу получить.
Можете ли вы указать мне инструменты, библиотеки, API и т.д., которые позволят мне программно читать текст в файлах PDF?