У меня есть файл с 17.7 ГБ на S3. Он был сгенерирован как результат запроса Hive, и он не сжат.
Я знаю, что, сжимая его, это будет около 2,2 ГБ (gzip). Как я могу загрузить этот файл локально как можно быстрее, когда передача является узким местом (250 кБ/с).
Я не нашел простого способа сжать файл на S3 или включить сжатие при передаче в s3cmd, boto или связанных с ним инструментах.