В соответствии с этим ответом: urllib2 читается в Юникоде
Мне нужно получить тип контента, чтобы перейти в unicode. Однако на некоторых сайтах нет "кодировки".
Например, ['content-type'] для эта страница является "text/html". Я не могу преобразовать его в unicode.
encoding=urlResponse.headers['content-type'].split('charset=')[-1]
htmlSource = unicode(htmlSource, encoding)
TypeError: 'int' object is not callable
Есть ли по умолчанию "кодировка" (на английском, конечно)... так что, если ничего не найдено, я могу просто использовать это?