У меня есть словарь словарей формы:
{'user':{movie:rating} }
Например,
{Jill': {'Avenger: Age of Ultron': 7.0,
'Django Unchained': 6.5,
'Gone Girl': 9.0,
'Kill the Messenger': 8.0}
'Toby': {'Avenger: Age of Ultron': 8.5,
'Django Unchained': 9.0,
'Zoolander': 2.0}}
Я хочу преобразовать этот dict dicts в фреймворк pandas со столбцом 1 имя пользователя и другие столбцы рейтинги фильмов i.e.
user Gone_Girl Horrible_Bosses_2 Django_Unchained Zoolander etc. \
Однако некоторые пользователи не оценивали фильмы и поэтому эти фильмы не включены в значения() для этого пользовательского ключа(). Было бы неплохо в этих случаях просто заполнить запись NaN.
На данный момент я перебираю ключи, заполняю список, а затем использую этот список для создания фрейма данных:
data=[]
for i,key in enumerate(movie_user_preferences.keys() ):
try:
data.append((key
,movie_user_preferences[key]['Gone Girl']
,movie_user_preferences[key]['Horrible Bosses 2']
,movie_user_preferences[key]['Django Unchained']
,movie_user_preferences[key]['Zoolander']
,movie_user_preferences[key]['Avenger: Age of Ultron']
,movie_user_preferences[key]['Kill the Messenger']))
# if no entry, skip
except:
pass
df=pd.DataFrame(data=data,columns=['user','Gone_Girl','Horrible_Bosses_2','Django_Unchained','Zoolander','Avenger_Age_of_Ultron','Kill_the_Messenger'])
Но это только дает мне фреймворк пользователей, которые оценили все фильмы в наборе.
Моя цель - добавить в список данных итерацию над метками фильма (вместо приведенного выше подхода к грубой силе) и, во-вторых, создать фрейм данных, который включает всех пользователей, и который помещает нулевые значения в элементы, которые не есть рейтинги фильмов.