Я хочу рассчитать mean
(или любую другую итоговую статистику длины один, например min
, max
, length
, sum
)) числовой переменной ( "значение" ) в каждом уровне переменная группировки ( "группа" ).
Сводная статистика должна быть назначена новой переменной, которая имеет ту же длину, что и исходные данные. То есть каждая строка исходных данных должна иметь значение, соответствующее текущему значению группы - набор данных не должен свертываться в одну строку на группу. Например, рассмотрим группу mean
:
Перед
id group value
1 a 10
2 a 20
3 b 100
4 b 200
После
id group value grp.mean.values
1 a 10 15
2 a 20 15
3 b 100 150
4 b 200 150