Я пытаюсь подсчитать дубликаты каждого типа строк в моем фреймворке. Например, скажем, что у меня есть dataframe в pandas следующим образом:
df = pd.DataFrame({'one' : pd.Series([1., 1, 1]), 'two' : pd.Series([1., 2., 1] )})
Я получаю df, который выглядит так:
one two
0 1 1
1 1 2
2 1 1
Я предполагаю, что первый шаг - найти все разные уникальные строки, которые я делаю:
df.drop_duplicates()
Это дает мне следующий df:
one two
0 1 1
1 1 2
Теперь я хочу взять каждую строку из приведенных выше df ([1 1] и [1 2]) и подсчитать количество раз в каждом начальном df. Мой результат будет выглядеть примерно так:
Row Count
[1 1] 2
[1 2] 1
Как мне сделать этот последний шаг?
Edit:
Здесь приведен более подробный пример:
df = pd.DataFrame({'one' : pd.Series([True, True, True, False]), 'two' : pd.Series([True, False, False, True] ), 'three' : pd.Series([True, False, False, False] )})
дает мне:
one three two
0 True True True
1 True False False
2 True False False
3 False False True
Мне нужен результат, который говорит мне:
Row Count
[True True True] 1
[True False False] 2
[False False True] 1