Работа с PANDAS, чтобы попытаться суммировать dataframe как количество определенных категорий, а также показатель оценки настроений для этих категорий.
Существует таблица, заполненная строками, которые имеют разные оценки настроений, и я хочу сгруппировать каждый текстовый источник, указав, сколько сообщений у них есть, а также среднее настроение этих сообщений.
Мой (упрощенный) dataframe выглядит так:
source text sent
--------------------------------
bar some string 0.13
foo alt string -0.8
bar another str 0.7
foo some text -0.2
foo more text -0.5
Результат этого должен быть примерно таким:
source count mean_sent
-----------------------------
foo 3 -0.5
bar 2 0.415
Ответ находится где-то рядом:
df['sent'].groupby(df['source']).mean()
Но только дает каждый источник, и это означает, без заголовков столбцов.
Заранее спасибо!