Синхронизация многих двоичных файлов

У меня около 100 000 файлов на офисном сервере (изображения, pdf и т.д.) Каждый день количество файлов увеличивается примерно на 100-500 элементов, и изменяется около 20-50 старых файлов.

Каков наилучший способ синхронизации веб-сервера с этими файлами? Может ли любая система, например Mercurial, GIT помочь? (На офисном сервере я буду совершать изменения, а веб-сервер периодически обновляет)?

Вторая проблема заключается в том, что на веб-сервере у меня есть пользовательский контент (двоичные файлы) (другие файлы). Каждый день пользователи загружают около 1000-2000 новых файлов. Старые файлы не меняются. И мне нужно сделать резервную копию этих файлов на локальном компьютере. Может ли такая система, как Merurial, GIT помочь в этой ситуации? (На веб-сервере я буду передавать эти файлы cron, а на локальном компьютере я буду делать обновления)

Спасибо

UPD.

Сервер Office - это Windows Server 2008 R2 Веб-сервер - Debian 5 lenny

Ответ 1

Самый простой и надежный механизм (по моему опыту) - rsync.

В Windows, однако, rsync over ssh сильно нарушается из-за проблем с тем, как Cygwin взаимодействует с именованными каналами. Rsync над своим собственным протоколом работает (пока вы не заботитесь о шифровании), но у меня было много проблем с получением rsync, чтобы оставаться в качестве службы Windows более нескольких дней за раз. DeltaCopy - это приложение для Windows, которое использует инструменты rsync за кулисами; это работает очень хорошо, хотя я не пробовал вариант ssh.

Ответ 2

DVCS не является хорошим решением в этом случае: он сохранит всю историю, которая вам не всегда нужна, и сделает любой клон массивной операцией.

репозиторий артефактов, например Nexus, гораздо более адаптирован, если вам нужно какое-то управление версиями с проверкой целостности, связанной с вашими двоичными файлами. В противном случае (без версий) достаточно простого rsync, например Marcelo .