Как извлечь ключевые слова из строки формата Python?

Я хочу предоставить автоматическое форматирование строк в API, чтобы:

my_api("path/to/{self.category}/{self.name}", ...)

можно заменить значениями атрибутов, вызываемых в строке форматирования.


Как извлечь аргументы ключевого слова из строки формата Python:

"non-keyword {keyword1} {{escaped brackets}} {} {keyword2}" => 'keyword1', 'keyword2'

Ответ 1

Вы можете использовать string.Formatter() для анализа полей в строке с помощью метода Formatter.parse():

from string import Formatter

fieldnames = [fname for _, fname, _, _ in Formatter().parse(yourstring) if fname]

Демо-версия:

>>> from string import Formatter
>>> yourstring = "path/to/{self.category}/{self.name}"
>>> [fname for _, fname, _, _ in Formatter().parse(yourstring) if fname]
['self.category', 'self.name']
>>> yourstring = "non-keyword {keyword1} {{escaped brackets}} {} {keyword2}"
>>> [fname for _, fname, _, _ in Formatter().parse(yourstring) if fname]
['keyword1', 'keyword2']

Вы можете разобрать эти имена полей дальше; для этого вы можете использовать метод str._formatter_field_name_split() (Python 2)/_string.formatter_field_name_split() (Python 3) (эта внутренняя деталь реализации не раскрывается иначе; Formatter.get_field() использует ее внутренне). Эта функция возвращает первую часть имени, ту, которая была бы найдена в аргументах, передаваемых str.format(), плюс генератор для остальной части поля.

Генератор выдает (is_attribute, name) кортежи; is_attribute имеет значение true, если следующее имя должно рассматриваться как атрибут, и false, если это элемент, который нужно искать с помощью obj[name]:

try:
    # Python 3
    from _string import formatter_field_name_split
except ImportError:
    formatter_field_name_split = str._formatter_field_name_split
from string import Formatter

field_references = {formatter_field_name_split(fname)[0]
 for _, fname, _, _ in Formatter().parse(yourstring) if fname}

Демо-версия:

>>> from string import Formatter
>>> from _string import formatter_field_name_split
>>> yourstring = "path/to/{self.category}/{self.name}"
>>> {formatter_field_name_split(fname)[0]
...  for _, fname, _, _ in Formatter().parse(yourstring) if fname}
{'self'}

Примите во внимание, что эта функция является частью внутренних деталей реализации класса Formatter() и может быть изменена или удалена из Python без предварительного уведомления и может даже не быть доступной в других реализациях Python.

Ответ 2

Если имена всех заполнителей названы, специальный словарь может использоваться для перехвата того, какие ключи были запрошены для доступа и внесены в журнал в массив.

def format_keys(str_):
    class HelperDict(dict):
        def __init__(self):
            self._keys = []
        def __getitem__(self, key):
            self._keys.append(key)    
    d = HelperDict()
    str_.format_map(d)
    return d._keys

Обратите внимание, что если есть неменованные заполнители, IndexError будет поднят .format() (индекс tuple вне диапазона).

Ответ 3

Создав ответ Martijn, более простой формат для исчерпывающего списка, который я использовал:

>>> yourstring = "path/to/{self.category}/{self.name}"
>>> [x[1] for x in yourstring._formatter_parser() if x[1]]
['self.category', 'self.name']

Это функционально точно то же самое, намного легче переварить.

Ответ 4

Вы можете сделать "path/to/{self.category}/{self.name}".format(self=self). Таким образом, вы можете работать с этими kwargs в __getattr__.