Инструменты для сравнения двух структур сайтов

Кто-нибудь знает о каких-либо инструментах, позволяющих сравнивать два почти одинаковых веб-сайта?

Просто у меня есть сайт-песочница и производственный сайт, и я хотел бы узнать разницу между ними, чтобы узнать, какой контент нужно переместить на производственный сайт.

Спасибо!

Edit:

Хорошо, я вижу, что пропустил критический фрагмент информации (извините!). Оба сайта находятся в режиме онлайн и основаны на CMS (Drupal), поэтому мне нужен инструмент обхода, который будет работать над двумя сайтами, и покажет, какие страницы присутствуют в песочнице, но не на производстве.

Спасибо всем, кто ответил независимо!

Ответ 1

Используйте httrack, чтобы вытащить копию сайтов, а затем ваш любимый инструмент сравнения файлов, чтобы просмотреть различия. (Я предпочитаю WinMerge, который может рекурсивно запускаться через две папки файлов, имеет опции, чтобы игнорировать различия в пробелах и пустые строки и даже запускать хорошо под Linux с использованием WINE.)

P.S. Возможно, вы даже захотите запустить загруженные файлы HTML через HTML Tidy, чтобы нормализовать/красиво отформатировать их перед выполнением сравнения.


Другим способом сделать это будет сравнение базы данных. Тем не менее, вы по-прежнему будете сравнивать файлы с исходными файлами сайта (а не с паутинной версией). Из памяти схема для базы данных Drupal не слишком сложна, особенно если вас интересует только контент node.

Ответ 2

Beyond Compare... чистая удивительность

Ответ 3

WinMerge - это бесплатный инструмент с открытым исходным кодом, который позволяет сравнивать файлы и каталоги.

Вы можете отображать файлы, которые идентичны, отличаются или существуют только в одном каталоге. И тогда вы можете сделать обе каталоги одинаковыми, скопировав файлы из одного каталога в другой.

Ответ 4

Как сказал солнечный, используйте сканер и инструмент для разметки.

Для искателя я бы предпочел httrack над wget. На многих сайтах в настоящее время используются изображения, на которые ссылается css. wget не смог загрузить файлы, на которые ссылается css, когда я последний раз проверял. Кроме того, он имеет приятный графический интерфейс.

Как инструмент сравнения: Я использую FileSync с Windows 3.1 дней. Есть, конечно, более причудливые инструменты для сравнения, но это тощий и чистый, делает работу. В unix вы всегда можете делать diff -r. Если у вас есть eclipse на вашем компьютере, у него есть хороший просмотрщик различий, который также может сравнивать два каталога.

Ответ 5

Meld хорош для этого, если вы используете Linux. Он доступен в репозиториях Debian/Ubuntu.

Ответ 6

Используйте wget для обхода сайтов, сравнение содержимого с помощью diff.

Или используйте инструмент diff в файлах script, а затем удалите базы данных в текстовых файлах (csv) и сравните.

Ответ 7

Помимо сравнения, замечательно. Syncback (http://www.2brightsparks.com/downloads.html) имеет бесплатную версию, и вы можете использовать любой инструмент слияния, например araxis или winmerge

Ответ 8

Поместите свой код в Subversion или какой-либо другой элемент управления источником. Когда он готов к развертыванию, svn update 'обновит только те вещи, которые изменились.

'svn diff' покажет различия.

Ответ 9

DiffMerge - еще один бесплатный инструмент для кросс-платформенных инструментов, поддерживающий разницу между каталогами.

Ответ 10

Вы также можете использовать некоторые онлайн-сервисы сравнения, такие как CopyScape или ChangeDetection