Json.loads(jsonstring) в Python терпит неудачу, если строка имеет символ возврата "\ r" i.e.

Я получаю строку JSON, которая имеет символ "\r" где-то, например. "{"data":"foo \r\n bar"}", когда я пытаюсь разобрать, он бросает ValueError.

>>> j="""{"data":"foo \r\n bar"}"""
>>> import json
>>> f=json.loads(j)

Traceback (most recent call last):
  File "<pyshell#2>", line 1, in <module>
    f=json.loads(j)
  File "C:\Python27\lib\json\__init__.py", line 326, in loads
    return _default_decoder.decode(s)
  File "C:\Python27\lib\json\decoder.py", line 366, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "C:\Python27\lib\json\decoder.py", line 382, in raw_decode
    obj, end = self.scan_once(s, idx)
ValueError: Invalid control character at: line 1 column 13 (char 13)
>>> j[13]
'\r'

"\r" является совершенно законным символом в строке Python.

Как я могу разобрать эту строку JSON, чтобы

>>> dct = somehow_parse_json(j)
>>> dct['data']
'foo \r\n bar'

Я мог бы легко найти и вернуть символы возврата каретки, но я бы предпочел, чтобы их можно было сохранить.

Ответ 1

Вы должны избегать косой черты в JSON:

j="""{"data":"foo \\r\\n bar"}"""

Если вы не избегаете их, ваш JSON недействителен (является допустимой строкой Python).

Ответ 2

Логически python делает то, что должно было быть сделано!

Его прежний старый CRLF (вдохновленный пишущими машинами) CR = Возврат к карриге LF = Линейный канал

'\ r' означает CR Но '\n' = CR + LF поэтому я хочу сказать, что для json его определенно недействительно.

Например:   print '\n 123456\rone'   # one3456

Теперь, как использовать \r в любом случае?

# if j is your json
j = j.replace('\r','\\r')

Это должно вывести только \r с помощью \\r