AWS S3 Sync очень медленный при копировании в большие каталоги

При синхронизации данных с пустым каталогом в S3 с использованием AWS-CLI это почти мгновенно. Однако при синхронизации с большим каталогом (несколько миллионов папок) требуется очень много времени, прежде чем начать загрузку/синхронизацию файлов.

Есть ли альтернативный метод? Похоже, что он пытается учесть все файлы в каталоге S3 перед синхронизацией - мне это не нужно, и загрузка данных без предварительной проверки будет в порядке.

Ответ 1

Команда sync должна будет перечислить все файлы в ведре, чтобы определить, существует ли локальный файл в ведре, и если он совпадает с локальным файлом. Чем больше документов у вас в ковше, тем дольше это займет.

Если вам не нужно это поведение sync используйте команду рекурсивного копирования, например:

aws s3 cp --recursive . s3://mybucket/

и это должно скопировать все локальные файлы в текущем каталоге в ведро в S3.