У меня есть набор данных с потенциально повторяющимися записями идентификатора appkey
. Дублированные записи в идеале не должны существовать, и поэтому я воспринимаю их как ошибки сбора данных. Мне нужно удалить все экземпляры appkey
, которые встречаются более одного раза.
Метод drop_duplicates
не полезен в этом случае (или он?), поскольку он либо выбирает первый, либо последний из дубликатов. Есть ли очевидная идиома для достижения этого с помощью pandas?