Я пытаюсь разобрать простой язык запроса = значение. Я на самом деле выполнил это с помощью огромного парсера чудовищ, чтобы затем сделать второй проход, чтобы очистить дерево синтаксического анализа. То, что я хотел бы сделать, это сделать чистый синтаксис снизу вверх, который включает в себя такие вещи, как использование наборов для пар (ключ, вал), поэтому лишние пары устраняются и т.д. Пока я его работал раньше, я не чувствую как я полностью понял, почему пираринг действовал так, как было, поэтому я много работал и т.д., вроде борьбы с зерном.
В настоящее время вот начало моего "упрощенного" синтаксического анализатора:
from pyparsing import *
bool_act = lambda t: bool(t[0])
int_act = lambda t: int(t[0])
def keyval_act(instring, loc, tokens):
return set([(tokens.k, tokens.v)])
def keyin_act(instring, loc, tokens):
return set([(tokens.k, set(tokens.vs))])
string = (
Word(alphas + '_', alphanums + '_')
| quotedString.setParseAction( removeQuotes )
)
boolean = (
CaselessLiteral('true')
| CaselessLiteral('false')
)
integer = Word(nums).setParseAction( int_act )
value = (
boolean.setParseAction(bool_act)
| integer
| string
)
keyval = (string('k') + Suppress('=') + value('v')
).setParseAction(keyval_act)
keyin = (
string('k') + Suppress(CaselessLiteral('in')) +
nestedExpr('{','}', content = delimitedList(value)('vs'))
).setParseAction(keyin_act)
grammar = keyin + stringEnd | keyval + stringEnd
В настоящее время нетерминал "грамматики" - это всего лишь заглушка, в конечном итоге я добавлю вложенные конъюнкции и дизъюнкции к клавишам, чтобы такие поисковые запросы могли быть проанализированы:
a = 1, b = 2 , c in {1,2,3} | d = 4, ( e = 5 | e = 2, (f = 3, f = 4))
Пока что, мне трудно понять, как pyparsing вызывает мои функции setParseAction. Я знаю, что есть какая-то магия с точки зрения того, сколько аргументов передано, но я получаю сообщение об ошибке, когда никакие аргументы вообще не передаются функции. Итак, в настоящее время, если я это сделаю:
grammar.parseString('hi in {1,2,3}')
Я получаю эту ошибку:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/python2.6/site-packages/pyparsing.py", line 1021, in parseString
loc, tokens = self._parse( instring, 0 )
File "/usr/lib/python2.6/site-packages/pyparsing.py", line 894, in _parseNoCache
loc,tokens = self.parseImpl( instring, preloc, doActions )
File "/usr/lib/python2.6/site-packages/pyparsing.py", line 2478, in parseImpl
ret = e._parse( instring, loc, doActions )
File "/usr/lib/python2.6/site-packages/pyparsing.py", line 894, in _parseNoCache
loc,tokens = self.parseImpl( instring, preloc, doActions )
File "/usr/lib/python2.6/site-packages/pyparsing.py", line 2351, in parseImpl
loc, resultlist = self.exprs[0]._parse( instring, loc, doActions, callPreParse=False )
File "/usr/lib/python2.6/site-packages/pyparsing.py", line 921, in _parseNoCache
tokens = fn( instring, tokensStart, retTokens )
File "/usr/lib/python2.6/site-packages/pyparsing.py", line 675, in wrapper
return func(*args[limit[0]:])
TypeError: keyin_act() takes exactly 3 arguments (0 given)
Как вы можете видеть из трассировки, я использую python2.6 и pyparsing 1.5.6
Может ли кто-нибудь дать мне некоторое представление о том, почему функция не получает правильное количество аргументов?