Я загрузил данные Facebook-мессенджера (в вашей учетной записи Facebook, перейдите к настройкам, затем в свою информацию в Facebook), затем загрузите свою информацию, затем создайте файл, по крайней мере, в поле "Сообщения"), чтобы сделать отличную статистику
Однако есть небольшая проблема с кодировкой. Я не уверен, но похоже, что Facebook использовал плохую кодировку для этих данных. Когда я открываю его с помощью текстового редактора, я вижу что-то вроде этого: Rados\u00c5\u0082aw
. Когда я пытаюсь открыть его с помощью python (UTF-8), я получаю RadosÅ\x82aw
. Однако я должен получить: Radosław
.
Мой скрипт python:
text = open(os.path.join(subdir, file), encoding='utf-8')
conversations.append(json.load(text))
Я пробовал несколько наиболее распространенных кодировок. Примеры данных:
{
"sender_name": "Rados\u00c5\u0082aw",
"timestamp": 1524558089,
"content": "No to trzeba ostatnie treningi zrobi\u00c4\u0087 xD",
"type": "Generic"
}