Это код:
print '"' + title.decode('utf-8', errors='ignore') + '",' \
' "' + title.decode('utf-8', errors='ignore') + '", ' \
'"' + desc.decode('utf-8', errors='ignore') + '")'
title и desc возвращаются Beautiful Soup 3 (p [0].text и p [0].prettify), и, насколько я могу понять из документации BeautifulSoup3, кодируется UTF-8.
Если я запустил
python.exe script.py > out.txt
Я получаю следующую ошибку:
Traceback (most recent call last):
File "script.py", line 70, in <module>
'"' + desc.decode('utf-8', errors='ignore') + '")'
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf8' in position 264
: ordinal not in range(128)
Однако, если я запустил
python.exe script.py
Я не ошибаюсь. Это происходит только в том случае, если указан выходной файл.
Как получить хорошие данные UTF-8 в выходном файле?