У меня есть dataframe с индексом timeindex и 3 столбцами, содержащими координаты 3D-вектора:
x y z
ts
2014-05-15 10:38 0.120117 0.987305 0.116211
2014-05-15 10:39 0.117188 0.984375 0.122070
2014-05-15 10:40 0.119141 0.987305 0.119141
2014-05-15 10:41 0.116211 0.984375 0.120117
2014-05-15 10:42 0.119141 0.983398 0.118164
Я хотел бы применить преобразование к каждой строке, которая также возвращает вектор
def myfunc(a, b, c):
do something
return e, f, g
но если я это сделаю:
df.apply(myfunc, axis=1)
В итоге я получаю серию Pandas, элементы которой являются кортежами. Это приложение beacause будет принимать результат myfunc без его распаковки. Как я могу изменить myfunc, чтобы получить новый df с тремя столбцами?
Edit:
Все нижеприведенные решения. Решение Series разрешает имена столбцов, похоже, что решение List выполняется быстрее.
def myfunc1(args):
e=args[0] + 2*args[1]
f=args[1]*args[2] +1
g=args[2] + args[0] * args[1]
return pd.Series([e,f,g], index=['a', 'b', 'c'])
def myfunc2(args):
e=args[0] + 2*args[1]
f=args[1]*args[2] +1
g=args[2] + args[0] * args[1]
return [e,f,g]
%timeit df.apply(myfunc1 ,axis=1)
100 loops, best of 3: 4.51 ms per loop
%timeit df.apply(myfunc2 ,axis=1)
100 loops, best of 3: 2.75 ms per loop