Я получаю файл через HTTP-Upload и должен быть уверен в его pdf файле. Язык программирования - это Python, но это не имеет значения.
Я подумал о следующих решениях:
-
Проверьте, являются ли первые байты строки "% PDF". Это не очень хорошая проверка, но не позволяет загружать другие файлы случайно.
-
Попробуйте libmagic (используется команда "файл" в bash). Это делает ту же проверку, что и 1.
-
Возьмите lib и попробуйте прочитать счетчик страниц из файла. Если lib может читать pagecount, он должен быть действительным pdf. Проблема: я не знаю lib для python, который может это сделать
У кого-нибудь есть какие-либо решения для lib или другого трюка?
Спасибо