Учитывая строку Unicode, я хочу заменить не-ASCII-символы кодом, создающим их LaTeX (например, é
станет \'e
и œ
станет \oe
). Я включаю это в код Python. Это должно основываться на таблице переводов, и я придумал следующий код, который прост и, кажется, работает красиво:
accents = [
[ u"à", "\\`a"],
[ u"é", "\\'e"]
]
translation_table = dict([(ord(k), unicode(v)) for k, v in accents])
print u"été à l'eau".translate(translation_table)
Но писать довольно полную таблицу переводов займет у меня много времени, и Google мало помог. У кого-то есть такая вещь, или знаете, где ее найти?
PS: Я новичок в Python, поэтому, конечно, приветствую комментарии к вышеуказанному коду.