У меня есть python- pandas -dataframe, в котором первым столбцом является user_id, а остальные столбцы - это теги (tag_0 - tag_122). У меня есть данные в следующем формате:
UserId Tag_0 Tag_1
7867688 0 5
7867688 0 3
7867688 3 0
7867688 3.5 3.5
7867688 4 4
7867688 3.5 0
Моя цель - достичь Sum(Tag)/Count(NonZero(Tags))
для каждого user_id
df.groupby('user_id').sum()
, дает мне sum(tag)
, однако я не знаю о подсчете ненулевых значений
Можно ли достичь Sum(Tag)/Count(NonZero(Tags))
по одной команде?
В MySQL я мог бы достичь этого следующим образом: -
select user_id, sum(tag)/count(nullif(tag,0)) from table group by 1
Любая помощь должна быть оценена.