Мои данные могут содержать несколько событий в заданную дату или NO-события на дату. Я принимаю эти события, получаю подсчет по дате и замышляю их. Однако, когда я их рисую, мои две серии не всегда совпадают.
idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max())
s = df.groupby(['simpleDate']).size()
В приведенном выше коде idx становится диапазон из 30 дат. 09-01-2013 - 09-30-2013 Однако S может иметь только 25 или 26 дней, потому что не было событий за определенную дату. Затем я получаю AssertionError, поскольку размеры не совпадают, когда я пытаюсь построить:
fig, ax = plt.subplots()
ax.bar(idx.to_pydatetime(), s, color='green')
Какой правильный способ справиться с этим? Я хочу удалить даты без каких-либо значений из IDX или (что я предпочел сделать) - добавить в серию недостающую дату со счетом 0. Я бы предпочел иметь полный график 30 дней с 0 значениями. Если этот подход является правильным, любые предложения о том, как начать работу? Мне нужна какая-то динамическая функция reindex
?
Здесь фрагмент S (df.groupby(['simpleDate']).size()
), не замечает записей для 04 и 05.
09-02-2013 2
09-03-2013 10
09-06-2013 5
09-07-2013 1