Я читаю огромный CSV
с полем даты в формате YYYYMMDD
, и я использую следующую лямбду для ее преобразования при чтении:
import pandas as pd
df = pd.read_csv(filen,
index_col=None,
header=None,
parse_dates=[0],
date_parser=lambda t:pd.to_datetime(str(t),
format='%Y%m%d', coerce=True))
Эта функция работает очень медленно.
Любое предложение по его улучшению?