Замените объекты html соответствующими символами utf-8 в Python 2.6 У меня есть html-текст: <xml ... > и я хочу преобразовать его в нечто читаемое: <xml ...> Любой простой (и быстрый) способ сделать это в Python? Ответ 1 http://docs.python.org/library/htmlparser.html >>> import HTMLParser >>> pars = HTMLParser.HTMLParser() >>> pars.unescape('© €') u'\xa9 \u20ac' >>> print _ © € Ответ 2 Существует функция здесь, которая делает это, как указано в сообщении Фреда. Скопировано здесь, чтобы облегчить ситуацию. Кредит Фреду Ларсону за ссылку на другой вопрос о SO. Поблагодарите dF за размещение ссылки.
Ответ 1 http://docs.python.org/library/htmlparser.html >>> import HTMLParser >>> pars = HTMLParser.HTMLParser() >>> pars.unescape('© €') u'\xa9 \u20ac' >>> print _ © €
Ответ 2 Существует функция здесь, которая делает это, как указано в сообщении Фреда. Скопировано здесь, чтобы облегчить ситуацию. Кредит Фреду Ларсону за ссылку на другой вопрос о SO. Поблагодарите dF за размещение ссылки.