У меня есть набор данных, чьи заголовки выглядят так:
PID Time Site Rep Count
Я хочу суммировать Count
на Rep
для каждого PID x Time x Site combo
в результирующем файле data.frame, я хочу получить среднее значение Count
для PID x Time x Site
комбо.
Текущая функция следующая:
dummy <- function (data)
{
A<-aggregate(Count~PID+Time+Site+Rep,data=data,function(x){sum(na.omit(x))})
B<-aggregate(Count~PID+Time+Site,data=A,mean)
return (B)
}
Это очень медленно (исходный data.frame 510000 20)
. Есть ли способ ускорить это с помощью plyr?