Как я могу определить, является ли файл двоичным (нетекстовым) в Python?
Я ищу большой набор файлов в Python и продолжаю получать совпадения в двоичных файлах. Это делает вывод выглядеть невероятно грязным.
Я знаю, что могу использовать grep -I
, но я делаю больше с данными, чем позволяет grep.
В прошлом я бы просто искал символы больше 0x7f
, но utf8
и тому подобное сделали бы это невозможным в современных системах. В идеале решение будет быстрым, но подойдет любое решение.