Я использую pandas как замену db, поскольку у меня есть несколько баз данных (oracle, mssql и т.д.), и я не могу сделать последовательность команд эквивалентом SQL.
У меня есть таблица, загруженная в DataFrame с некоторыми столбцами:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
В SQL подсчитать количество разных клиентов в год будет:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
И результатом будет
201301 5000
201302 13245
Как это сделать в pandas?