Не удается получить pyparsing Dict() для возврата вложенного словаря

Я пытаюсь разобрать строки формы:

'foo(bar:baz;x:y)'

Мне бы хотелось, чтобы результаты были возвращены в виде вложенного словаря, то есть для указанной строки результаты должны выглядеть так:

{ 'foo' : { 'bar' : 'baz', 'x' : 'y' } }

Несмотря на многочисленные комбинации Dict() и Group(), я не могу заставить его работать. Моя (одна из версий) грамматика выглядит так:

import pyparsing as pp
field_name = pp.Word( pp.alphanums )
field_value = pp.Word( pp.alphanums )
colon = pp.Suppress( pp.Literal( ':' ) )

expr = pp.Dict( 
    pp.Group( 
        field_name + \
        pp.nestedExpr( 
            content = pp.delimitedList( 
                 pp.Group( field_name + colon + field_value ), 
                 delim = ';' 
            ) 
        ) 
    ) 
)

и теперь результаты следующие:

In [62]: str = 'foo(bar:baz;x:y)'

In [63]: expr.parseString( str ).asList()
Out[63]: [['foo', [['bar', 'baz'], ['x', 'y']]]]

In [64]: expr.parseString( str ).asDict()
Out[64]: {'foo': ([(['bar', 'baz'], {}), (['x', 'y'], {})], {})}

In [65]: print( expr.parseString( str ).dump() )
Out[65]: [['foo', [['bar', 'baz'], ['x', 'y']]]]
         - foo: [['bar', 'baz'], ['x', 'y']]

Итак, версия asList() выглядит неплохо для меня и должна давать словарь, который я буду думать. Конечно, учитывая, что (как я понимаю, пожалуйста, поправьте меня) Dict() будет анализировать списки токенов, используя первый элемент списка в качестве ключа, а все остальные - значения этого ключа в словаре. Это работает, поскольку словарь не вложен. Например, в таком случае:

expr = pp.Dict( 
    pp.delimitedList( 
        pp.Group( field_name + colon + field_value ), 
        delim = ';' 
    ) 
)

In [76]: expr.parseString( 'foo:bar;baz:x' ).asDict()
Out[76]: {'baz': 'x', 'foo': 'bar'}

Итак, вопрос в том, что не так с первым случаем (и моим пониманием проблемы), или, возможно, Dict() не может справиться с таким случаем? Я мог бы использовать asList() и преобразовать это вручную в словарь, но я бы предпочел бы, чтобы это произошло:)

Любая помощь или указания будут очень оценены.

Спасибо.

Ответ 1

Две проблемы:

  • Вам не хватает pp.Dict вокруг pp.delimitedList, чтобы сделать asDict правильной внутренней работы
  • Вы вызываете asDict только в самом внешнем экземпляре ParsingResult, оставляя внутреннее ParsingResult "неинтерпретированное"

Я попробовал следующее:

from pyparsing import *
field_name = field_val = Word(alphanums)
colon = Suppress(Literal(':'))

expr = Dict(Group(
    field_name +
    nestedExpr(content =
        Dict(delimitedList( 
            Group(field_name + colon + field_value), 
            delim = ';' 
        ))
    )
))

Затем использовал его следующим образом:

>>> res = expr.parseString('foo(bar:baz;x:y)')
>>> type(res['foo'])
<class 'pyparsing.ParseResults'>
>>> { k:v.asDict() for k,v in res.asDict().items() }
{'foo': {'x': 'y', 'bar': 'baz'}}