Интересно, есть ли более простой способ вычислить определенный тип переменных, чем обычно подходит подход, который я обычно делаю....
Пример ниже, вероятно, объясняет это лучше всего. У меня есть dataframe с 2 столбцами (фрукты и плод ли гниль или нет). Я бы хотел, чтобы для каждой строки добавляли, например. процент плодов той же категории, что и гнилой. Например, есть 4 записи для яблок, 2 из них гнилые, поэтому каждая строка для яблока должна читать 0,5. Целевые значения (чисто как иллюстрация) включены в столбец "желаемый результат".
Ранее я столкнулся с этой проблемой * используя команду "ddply" для переменной фрукта (с функцией sum/lenght as), создавая новый 3f 2-й фрейм * используйте команду "merge", чтобы связать эти значения с прежним фреймворком данных.
Это похоже на обходной путь, и мне было интересно, есть ли лучший способ сделать это быстрее! идеал общий подход, который легко регулируется, если один вместо процента должен определить, например, все плоды гнилые, любые плоды гнилые и т.д. и т.д. и т.д.
Большое спасибо заранее,
W
Fruit Rotten Desired_Outcome_PercRotten
1 Apple 1 0.5
2 Apple 1 0.5
3 Apple 0 0.5
4 Apple 0 0.5
5 Pear 1 0.75
6 Pear 1 0.75
7 Pear 1 0.75
8 Pear 0 0.75
9 Cherry 0 0
10 Cherry 0 0
11 Cherry 0 0
#create example datagram; desired outcome columns are purely inserted as illustrative of target outcomes
Fruit=c(rep("Apple",4),rep("Pear",4),rep("Cherry",3))
Rotten=c(1,1,0,0,1,1,1,0,0,0,0)
Desired_Outcome_PercRotten=c(0.5,0.5,0.5,0.5,0.75,0.75,0.75,0.75,0,0,0)
df=as.data.frame(cbind(Fruit,Rotten,Desired_Outcome_PercRotten))
df