У меня есть строка. В этой строке есть двойная обратная косая черта. Я хочу заменить двойные обратные косые черты одиночными обратными косыми чертами, так что коды юникода char могут быть правильно проанализированы.
(Pdb) p fetched_page
'<p style="text-align:center;" align="center"><strong><span style="font-family:\'Times New Roman\', serif;font-size:115%;">Chapter 0<\\/span><\\/strong><\\/p>\n<p><span style="font-family:\'Times New Roman\', serif;font-size:115%;">Chapter 0 in \\u201cDreaming in Code\\u201d give a brief description of programming in its early years and how and why programmers are still struggling today...'
Внутри этой строки вы можете увидеть escape-коды символов юникода, например:
\\u201c
Я хочу превратить это в:
\u201c
Попытка 1:
fetched_page.replace('\\\\', '\\')
но это не сработает - он ищет четырехкратную обратную косую черту.
Попытка 2:
fetched_page.replace('\\', '\')
Но это приводит к ошибке конца строки.
Попытка 3:
fetched_page.decode('string_escape')
Но это не повлияло на текст. Все двойные обратные косые черты остались как двойные обратные косые черты.