Я пытаюсь удалить повторяющиеся наблюдения из набора данных на основе моей переменной id. Однако я хочу, чтобы удаление наблюдений основывалось на следующих правилах. Переменные ниже - это id, пол главы домохозяйства (1-мужчина, 2-женщина) и возраст главы домашнего хозяйства. Правила заключаются в следующем. Если в домохозяйстве есть главы мужского и женского домохозяйств, удалите наблюдение за домашними хозяйствами женщин. Если домашнее хозяйство как две мужские или две женские головы, удалите наблюдение с младшей головкой домашнего хозяйства. Ниже приведен пример набора данных.
id = c(1,2,2,3,4,5,5,6,7,8,8,9,10)
sex = c(1,1,2,1,2,2,2,1,1,1,1,2,1)
age = c(32,34,54,23,32,56,67,45,51,43,35,80,45)
data = data.frame(cbind(id,sex,age))