Я ищу эффективный (как компьютерный ресурс, так и метод обучения/реализации), чтобы объединить два больших (размеp > 1 миллион /300 КБ файлов данных RData).
"merge" в базе R и "join" в plyr, по-видимому, используют всю мою память, эффективно разбивая мою систему.
Пример
load тестовый кадр данных
и попробуйте
test.merged<-merge(test, test)
или
test.merged<-join(test, test, type="all")
- -
Следующая публикация содержит список слияний и альтернатив:
Как объединить кадры данных (внутренние, внешние, левые, правые)?
Следующее позволяет проверить размер объекта:
https://heuristically.wordpress.com/2010/01/04/r-memory-usage-statistics-variable/
Данные, созданные аноним