Этот вопрос касается универсального механизма преобразования любого набора нециклических однородных или гетерогенных структур данных в кадр данных. Это может быть особенно полезно при работе с многими документами JSON или с большим документом JSON, который представляет собой набор словарей.
Есть несколько вопросов SO, которые касаются манипулирования глубоко вложенными структурами JSON и превращения их в dataframes с использованием таких функций, как plyr
, lapply
и т.д. Все вопросы и ответы, которые я нашел, касаются конкретных случаев, в отличие от предлагая общий подход к работе с коллекциями сложных структур данных JSON.
В Python и Ruby мне хорошо удалось реализовать универсальную утилиту для выравнивания структуры данных, которая использует путь к листу node в структуре данных как имя значения в этом node в сплющенном структура данных. Например, значение my_data[['x']][[2]][['y']]
будет выглядеть как result[['x.2.y']]
.
Если у вас есть набор этих структур данных, которые могут быть не совсем однородными, ключом к успешному сглаживанию к фреймворку данных будет поиск имен всех возможных столбцов данных, например, путем объединения всех ключей/имена значений в индивидуально сплющенных структурах данных.
Это похоже на общий шаблон, и поэтому мне интересно, кто-то уже построил это для R. Если нет, я его построю, но, учитывая R уникальных структур данных, основанных на обещаниях, я был бы признателен за советы по который минимизирует переполнение кучи.