Я начинаю с документов панд на DataFrame здесь: http://pandas.pydata.org/pandas-docs/stable/dsintro.html
Я хотел бы итеративно заполнять DataFrame значениями для расчета временных рядов. В общем, я хотел бы инициализировать DataFrame столбцами A, B и строками отметок времени, все 0 или все NaN.
Затем я добавляю начальные значения и просматриваю эти данные, вычисляя новую строку из row[A][t] = row[A][t-1]+1
строки, скажем, row[A][t] = row[A][t-1]+1
или около того.
В настоящее время я использую код, как показано ниже, но я чувствую себя немного уродливо, и должен быть способ сделать это напрямую с помощью DataFrame, или просто лучше. Примечание: я использую Python 2.7.
import datetime as dt
import pandas as pd
import scipy as s
if __name__ == '__main__':
base = dt.datetime.today().date()
dates = [ base - dt.timedelta(days=x) for x in range(0,10) ]
dates.sort()
valdict = {}
symbols = ['A','B', 'C']
for symb in symbols:
valdict[symb] = pd.Series( s.zeros( len(dates)), dates )
for thedate in dates:
if thedate > dates[0]:
for symb in valdict:
valdict[symb][thedate] = 1+valdict[symb][thedate - dt.timedelta(days=1)]
print valdict