Как создать цепочный конвейер?

Я хотел бы создать простой конвейер, я нашел этот > простой пример:

"""
From /info/33100/piping-output-from-one-function-to-another-using-python-infix-syntax
"""
import collections

def pipe(original):
    """
    """

    class PipeInto(object):
        data = {'function': original}

        def __init__(self, *args, **kwargs):
            self.data['args'] = args
            self.data['kwargs'] = kwargs

        def __rrshift__(self, other):
            return self.data['function'](
                other,
                *self.data['args'],
                **self.data['kwargs']
            )
        def __call__(self):
            return self.data['function'](
                *self.data['args'],
                **self.data['kwargs']
            )

    return PipeInto

@pipe
def select(df, *args):
    cols = [x for x in args]
    return df[cols]

Пока df >> select('one') отлично работает, pipe= select(df, 'one') возвращает объект, который нужно вызвать. Как select(df, 'one') работает как простой вызов функции, который возвращает отфильтрованный DataFrame?

Ответ 1

Ну, я могу думать о решении, но есть предостережение: ваша исходная функция не должна принимать второй позиционный аргумент, который является pandas dataframe (аргументы ключевого слова в порядке). Переключает __call__ и добавляет метод __new__ к нашему классу PipeInto внутри декоратора. Этот новый конструктор проверяет, является ли первый аргумент файловой рамкой, и если это тогда, мы просто вызываем исходную функцию с аргументами:

def __new__(cls, *args, **kwargs):
    if args and isinstance(args[0], pd.DataFrame):
        return cls.data['function'](*args, **kwargs)
    return super().__new__(cls)

Кажется, работает, дайте мне знать, если вы найдете недостаток.

>>> df = pd.DataFrame({'one' : [1., 2., 3., 4., 4.],
                       'two' : [4., 3., 2., 1., 3.]})

>>> select(df, 'one')
   one
0  1.0
1  2.0
2  3.0
3  4.0
4  4.0

>>> df >> select('one')
   one
0  1.0
1  2.0
2  3.0
3  4.0
4  4.0