Это расширение существующего вопроса: Преобразование таблицы в матрицу по именам столбцов
Я использую окончательный ответ: qaru.site/info/43123/...
Оригинальная матрица файлов CSV имеет около 1,5 М строк с тремя столбцами... индекс строки, индекс столбца и значение. Все числа являются длинными целыми числами. Основная матрица представляет собой разреженную матрицу размером около 220K x 220K со средним значением около 7 значений в строке.
Оригинал read.table работает просто отлично.
x <- read.table("/users/wallace/Hadoop_Local/reference/DiscoveryData6Mo.csv", header=TRUE);
Моя проблема возникает, когда я делаю команду reshape.
reshape(x, idvar="page_id", timevar="reco", direction="wide")
Процессор достигает 100%, и там он сидит вечно. Машина (mac) имеет больше памяти, чем используется R. Я не понимаю, почему так долго нужно строить разреженную матрицу.
Я использую пакет матрицы по умолчанию. Я ничего не установил. Я просто скачал R несколько дней назад, поэтому у меня должна быть последняя версия.
Предложения?
Спасибо, Уоллес