У меня есть dataframe, где один столбец представляет собой список групп, к которым принадлежит каждый из моих пользователей. Что-то вроде:
index groups
0 ['a','b','c']
1 ['c']
2 ['b','c','e']
3 ['a','c']
4 ['b','e']
И то, что я хотел бы сделать, это создать серию фиктивных столбцов, чтобы определить, к каким группам принадлежит каждый пользователь, чтобы выполнить некоторые анализы.
index a b c d e
0 1 1 1 0 0
1 0 0 1 0 0
2 0 1 1 0 1
3 1 0 1 0 0
4 0 1 0 0 0
pd.get_dummies(df['groups'])
не будет работать, потому что это просто возвращает столбец для каждого другого списка в моем столбце.
Решение должно быть эффективным, так как dataframe будет содержать 500 000 строк. Любые советы будут оценены!