Я пишу какое-то программное обеспечение для обработки почты в Python, которое встречает странные байты в полях заголовков. Я подозреваю, что это просто неправильная почта; само сообщение утверждает, что оно является us-ascii, поэтому я не думаю, что есть истинная кодировка, но я хотел бы получить строку юникода, аппроксимирующую исходную, не выбрасывая UnicodeDecodeError
.
Итак, я ищу функцию, которая принимает str
и, возможно, некоторые подсказки и делает ее darndest, чтобы вернуть мне unicode
. Я мог бы написать один из них, но если такая функция существует, ее автор, вероятно, подумал немного глубже о том, как лучше всего это сделать.
Я также знаю, что дизайн Python предпочитает явно неявное и что стандартная библиотека предназначена для предотвращения неявной магии в декодировании текста. Я просто хочу прямо сказать "идти вперед и угадать".