У меня есть DataFrame, который имеет дублированные строки. Я бы хотел получить DataFrame с уникальным индексом и без дубликатов. Можно отказаться от дублированных значений. Это возможно? Это будет сделано groupby
?
Pandas: уникальный dataframe
Ответ 1
In [29]: df.drop_duplicates()
Out[29]:
b c
1 2 3
3 4 0
7 5 9
Ответ 2
Выясните один из способов сделать это, прочитав примеры документации split-apply-comb.
df = pandas.DataFrame({'b':[2,2,4,5], 'c': [3,3,0,9]}, index=[1,1,3,7])
df_unique = df.groupby(level=0).first()
df
b c
1 2 3
1 2 3
3 4 0
7 5 9
df_unique
b c
1 2 3
3 4 0
7 5 9