У меня есть DataFrame с двумя столбцами, датой и категорией. Я хочу создать новый столбец даты в соответствии с правилом: если категория равна B
тогда значение должно быть ближе к дате рабочего дня (только из прошлого или самого дня), иначе это значение самого столбца даты.
Я определяю рабочий день как любой день, который не находится на выходных, и не присутствует в списке holidays
указанных в минимальном примере ниже.
Пожалуйста, рассмотрите следующий DataFrame df
:
import datetime as dt
import pandas as pd
from IPython.display import display
holidays = [dt.datetime(2018, 10, 11)]
df = pd.DataFrame({"day": ["2018-10-10", "2018-10-11", "2018-10-12",
"2018-10-13", "2018-10-14", "2018-10-15"
],
"category":["A", "B", "C", "B", "C", "A"]
}
)
df["day"] = pd.to_datetime(df.day, format="%Y-%m-%d")
display(df)
day category
0 2018-10-10 A
1 2018-10-11 B
2 2018-10-12 C
3 2018-10-13 B
4 2018-10-14 C
5 2018-10-15 A
Как получить третий столбец, значения которого перечислены ниже?
2018-10-10
2018-10-10
2018-10-12
2018-10-12
2018-10-14
2018-10-15
У меня есть функция, которая находит последний рабочий день при работе со списками, если это поможет.
# creates a list whose elements are all days in the years 2017, 2018 and 2019
days = [dt.datetime(2017, 1 , 1) + dt.timedelta(k) for k in range(365*3)]
def lastt_bus_day(date):
return max(
[d for d in days if d.weekday() not in [5, 6]
and d not in holidays
and d <= date
]
)
for d in df.day:
print(last_bus_day(d))
#prints
2018-10-10 00:00:00
2018-10-10 00:00:00
2018-10-12 00:00:00
2018-10-12 00:00:00
2018-10-12 00:00:00
2018-10-15 00:00:00