Преобразование кодировки от XXX до utf-8, командной строки
У меня есть куча текстовых файлов, которые закодированы в ISO-8851-2 (имеют некоторые польские символы). Есть ли инструмент командной строки для linux/mac, который я мог бы запустить из оболочки script, чтобы преобразовать это в saner utf-8?
Ответ 1
В командной строке используйте
iconv -f LATIN1 -t UTF8
Вы можете добавить //TRANSLIT в UTF8.
Ответ 2
recode latin2..utf8 myfile.txt
Это перезапишет myfile.txt новой версией. Вы также можете использовать перекодировку без имени файла в качестве канала.