Я нахожусь на python 2.6 для Windows.
Я использую os.walk для чтения дерева файлов. Файлы могут иметь не-7-битные символы (например, немецкий "ae" ) в именах файлов. Они закодированы во внутреннем строчном представлении Pythons.
Я обрабатываю эти имена файлов с помощью функций библиотеки Python и не получается из-за неправильной кодировки.
Как я могу преобразовать эти имена файлов в правильные (unicode?) строки python?
У меня есть файл "d:\utest\ü.txt". Передача пути в виде unicode не работает:
>>> list(os.walk('d:\\utest'))
[('d:\\utest', [], ['\xfc.txt'])]
>>> list(os.walk(u'd:\\utest'))
[(u'd:\\utest', [], [u'\xfc.txt'])]