В следующем фрагменте data
есть pandas.DataFrame
, а indices
- это набор столбцов data
. После группировки данных с помощью groupby
меня интересуют идентификаторы групп, но только те, размер которых превышает порог (скажем: 3).
group_ids=data.groupby(list(data.columns[list(indices)])).grouper.group_info[0]
Теперь, как я могу найти, какая группа имеет размер больше или равен 3, зная идентификатор группы? Я хочу только идентификаторы групп с определенным размером.
#TODO: filter out ids from group_ids which correspond to groups with sizes < 3