Я использую Python Pandas в первый раз. У меня есть 5-минутные данные трафика задержки в формате csv:
...
2015-01-04 08:29:05,271238
2015-01-04 08:34:05,329285
2015-01-04 08:39:05,-1
2015-01-04 08:44:05,260260
2015-01-04 08:49:05,263711
...
Есть несколько проблем:
- для некоторых временных меток отсутствуют данные (-1)
- отсутствующие записи (также 2/3 последовательных часа)
- частота наблюдений не составляет ровно 5 минут, но на самом деле теряет несколько секунд раз в то время
Я хотел бы получить регулярные временные ряды, поэтому с записями каждые (ровно) 5 минут (и без пропущенных значений). Я успешно интерполировал временные ряды со следующим кодом для приближения значений -1 с помощью этого кода:
ts = pd.TimeSeries(values, index=timestamps)
ts.interpolate(method='cubic', downcast='infer')
Как я могу интерполировать и упорядочить частоту наблюдений? Спасибо всем за помощь.