Функция, дублируемая в R, выполняет поиск дубликатов строк. Если мы хотим удалить дубликаты, нам нужно просто написать df[!duplicated(df),]
, и дубликаты будут удалены из фрейма данных.
Но как найти индексы дублированных данных? Если duplicated
возвращает TRUE в некоторой строке, это означает, что это второе появление такой строки в кадре данных, и его индекс может быть легко получен. Как получить индекс первого появления этой строки? Или, другими словами, индекс, с которым дублированная строка идентична?
Я мог бы создать цикл на data.frame, но я думаю, что есть более элегантный ответ на этот вопрос.