Это, наверное, глупый вопрос, но я прочитал главу Crawley о dataframes и просмотрел Интернет и еще не смог заставить что-либо работать.
Вот примерный набор данных, похожий на мой:
> data<-data.frame(site=c("A","A","A","A","B","B"), plant=c("buttercup","buttercup",
"buttercup","rose","buttercup","rose"), treatment=c(1,1,2,1,1,1),
plant_numb=c(1,1,2,1,1,2), fruits=c(1,2,1,4,3,2),seeds=c(45,67,32,43,13,25))
> data
site plant treatment plant_numb fruits seeds
1 A buttercup 1 1 1 45
2 A buttercup 1 1 2 67
3 A buttercup 2 2 1 32
4 A rose 1 1 4 43
5 B buttercup 1 1 3 13
6 B rose 1 2 2 25
Я бы хотел создать сценарий, где "семена" и "фрукты" суммируются всякий раз, когда существуют уникальные комбинации сайтов и растений, а также комбинации plant_numb. В идеале это приведет к сокращению строк, но сохранению исходных столбцов (т.е. Мне нужно, чтобы приведенный выше пример выглядел так:)
site plant treatment plant_numb fruits seeds
1 A buttercup 1 1 3 112
2 A buttercup 2 2 1 32
3 A rose 1 1 4 43
4 B buttercup 1 1 3 13
5 B rose 1 2 2 25
Этот пример довольно простой (мой набор данных составляет ~ 5000 строк), и хотя здесь вы видите только две строки, которые должны быть суммированы, количество строк, которые нужно суммировать, варьируется и варьируется от 1 до ~ 45.
Я пробовал rowsum() и tapply() с довольно мрачными результатами до сих пор (ошибки говорят мне, что эти функции не имеют смысла для факторов), поэтому, если бы вы могли даже указать мне в правильном направлении, я бы очень ценю это!
Большое спасибо!