В Linux у меня есть каталог с большим количеством файлов. Некоторые из них имеют символы, отличные от ASCII, но все они действительны UTF-8. У одной программы есть ошибка, которая предотвращает ее работу с именами, отличными от ASCII, и я должен выяснить, сколько из них затронуто. Я собирался сделать это с помощью find
, а затем сделать grep для печати символов, отличных от ASCII, а затем сделать wc -l
, чтобы найти номер. Это не должно быть grep; Я могу использовать любое стандартное Unix регулярное выражение, например Perl, sed, AWK и т.д.
Однако существует ли регулярное выражение для "любого символа, который не является символом ASCII"?