Я пытаюсь решить это, но я не могу понять, как читать zipped.csv файлы в R. Я мог бы сначала разархивировать файлы, а затем прочитать их, но поскольку количество распакованных данных составляет около 22 ГБ, Я думаю, что более практично обрабатывать сжатые файлы.
В основном у меня много файлов .csv, которые я ZIPPED ONE BY ONE в одиночные файлы .7z. Каждый файл имеет имя: file1.csv
, file2.csv
и т.д., Которые были застегнуты соответственно: file1.csv.7z
, file2.csv.7z
и т.д.
Если я использую следующую команду:
data <- read.table(unz("substn-20100101.csv.7z", "substn-20100101.csv"), nrows=10, header=T, quote="\"", sep=",")
Я получаю сообщение:
Error in open.connection(file, "rt") : cannot open the connection
In addition: Warning message:
In open.connection(file, "rt") : cannot open zip file 'substn-20100101.7z'
Любая помощь будет очень признательна, спасибо заранее.