У меня есть df, созданный почти 50 000 строк, распространенных в 15 разных идентификаторах (каждый идентификатор имеет тысячи наблюдений). df выглядит так:
ID Year Temp ph
1 P1 1996 11.3 6.80
2 P1 1996 9.7 6.90
3 P1 1997 9.8 7.10
...
2000 P2 1997 10.5 6.90
2001 P2 1997 9.9 7.00
2002 P2 1997 10.0 6.93
Я хочу взять 500 случайных строк для каждого ID (так 500 для P1, 500 для P2,....) и создать новый df. Я пытаюсь:
new_df<-df[df$ID %in% sample(unique(dfID),500),]
Но он принимает случайным образом один идентификатор, в то время как мне нужен 500 случайных строк для каждого ID.