Поиск равных значений из списка списка кортежей в Python

После многократного поиска мне нужна помощь.

У меня есть список списков кортежей. Каждый список внутри списка списка представляет собой определенное количество формул в моей системе. Любой элемент в этом списке является кортежем, который представляет тип элемента (переменная, параметр, константа, операция...) и имя элемента. Например, для формул x1 + x2 + A1, x1-x3 и sin (x2) + A1 мы будем иметь:

[
[('VAR', 'x1'), ('PLUS', '+'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')],
[('VAR', 'x1'), ('LESS', '-'), ('VAR', 'x3')],
[('SIN', 'sin'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')]
]

Я пытаюсь определить, в какой формуле появляется каждая переменная. В приведенном выше примере я имею, что переменная x1 имеет формулу 1 и 2, переменная x2 находится по формуле 1 и 3 и x3 в формуле 2, поэтому мой вывод будет примерно таким:

[
['x1', 1, 2],
['x2', 1, 3],
['x3', 2],
]

В настоящий момент у меня очень неэффективный код, который вообще не работает, но вот он:

cont = 0
for subL1 in L:
    for subL2 in L:
        if len(subL1) != 1 and len(subL2) != 1:
            if subL1 != subL2 and subL2:
                for x,y in subL1:
                    for z,t in subL2:
                        if (    x == 'VAR'
                            and z == 'VAR'
                            and y == t
                            ):
                            print "Variable", y , "repeated"
        else:
            print "list with 1 lenght\n"
    subL1.pop(0)
cont = cont + 1

Ответ 1

Вы можете использовать collections.defaultdict для хранения формул (фактически индексов внутри списка списков) для каждой переменной:

from collections import defaultdict

dd = defaultdict(set)              # use a set as factory so we don't keep duplicates
for idx, subl in enumerate(l, 1):  # iterate over the sublists with index starting at 1
    for subt in subl:              # iterate over each tuple in each sublist
        label, val = subt          # unpack the tuple
        if label == 'VAR':         # if it a VAR save the index in the defaultdict
            dd[val].add(idx)

Например:

l = [[('VAR', 'x1'), ('PLUS', '+'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')],
     [('VAR', 'x1'), ('LESS', '-'), ('VAR', 'x3')],
     [('SIN', 'sin'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')]
    ]

Он дает:

print(dd)
# defaultdict(set, {'x1': {1, 2}, 'x2': {1, 3}, 'x3': {2}})

Чтобы получить желаемый результат, вам нужно только преобразовать его в список, например (только для python-3.x):

>>> [[name, *sorted(formulas)] for name, formulas in sorted(dd.items())]
[['x1', 1, 2], ['x2', 1, 3], ['x3', 2]]

Ответ 2

formula = [
[('VAR', 'x1'), ('PLUS', '+'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')],
[('VAR', 'x1'), ('LESS', '-'), ('VAR', 'x3')],
[('SIN', 'sin'), ('VAR', 'x2'), ('PLUS', '+'), ('PAR', 'A1')]
]

variables = collections.defaultdict(set)
for line_no, line in enumerate(formula):
    for typ, value in line:
        if typ == 'VAR':
            variables[value].add(line_no)
variables

defaultdict (set, {'x1': {0, 1}, 'x2': {0, 2}, 'x3': {1}})