Я пытаюсь разобрать строки формы:
'foo(bar:baz;x:y)'
Мне бы хотелось, чтобы результаты были возвращены в виде вложенного словаря, то есть для указанной строки результаты должны выглядеть так:
{ 'foo' : { 'bar' : 'baz', 'x' : 'y' } }
Несмотря на многочисленные комбинации Dict() и Group(), я не могу заставить его работать. Моя (одна из версий) грамматика выглядит так:
import pyparsing as pp
field_name = pp.Word( pp.alphanums )
field_value = pp.Word( pp.alphanums )
colon = pp.Suppress( pp.Literal( ':' ) )
expr = pp.Dict(
pp.Group(
field_name + \
pp.nestedExpr(
content = pp.delimitedList(
pp.Group( field_name + colon + field_value ),
delim = ';'
)
)
)
)
и теперь результаты следующие:
In [62]: str = 'foo(bar:baz;x:y)'
In [63]: expr.parseString( str ).asList()
Out[63]: [['foo', [['bar', 'baz'], ['x', 'y']]]]
In [64]: expr.parseString( str ).asDict()
Out[64]: {'foo': ([(['bar', 'baz'], {}), (['x', 'y'], {})], {})}
In [65]: print( expr.parseString( str ).dump() )
Out[65]: [['foo', [['bar', 'baz'], ['x', 'y']]]]
- foo: [['bar', 'baz'], ['x', 'y']]
Итак, версия asList()
выглядит неплохо для меня и должна давать словарь, который я буду думать. Конечно, учитывая, что (как я понимаю, пожалуйста, поправьте меня) Dict() будет анализировать списки токенов, используя первый элемент списка в качестве ключа, а все остальные - значения этого ключа в словаре. Это работает, поскольку словарь не вложен. Например, в таком случае:
expr = pp.Dict(
pp.delimitedList(
pp.Group( field_name + colon + field_value ),
delim = ';'
)
)
In [76]: expr.parseString( 'foo:bar;baz:x' ).asDict()
Out[76]: {'baz': 'x', 'foo': 'bar'}
Итак, вопрос в том, что не так с первым случаем (и моим пониманием проблемы), или, возможно, Dict() не может справиться с таким случаем? Я мог бы использовать asList()
и преобразовать это вручную в словарь, но я бы предпочел бы, чтобы это произошло:)
Любая помощь или указания будут очень оценены.
Спасибо.