Загрузить веб-страницу и зависимости, включая css-изображения

Часто мне нужно загрузить веб-страницу, а затем отредактировать ее в автономном режиме. Я попробовал несколько инструментов, а основной функции, которой они не хватает, является загрузка изображений, на которые ссылаются в файлах CSS.

Есть ли инструмент (для Linux), который будет загружать все, чтобы веб-страница отображалась в том же автономном режиме (исключая AJAX)?

Ответ 1

wget --page-requisites http://example.com/your/page.html

Эта опция заставляет Wget загружать все файлы, необходимые для правильного отображения данной html-страницы. Это включает в себя такие вещи, как встроенные изображения, звуки и ссылочные таблицы стилей.

РЕДАКТ: медитер прав: фондовый wget не анализирует и не загружает изображения css. Существует, однако, патч, который добавляет эту функцию: [1, 2]дел >

ОБНОВЛЕНИЕ: патч, упомянутый выше был объединен с wget 1.12, выпущенным 22 сентября 2009 года:

** Added support for CSS. This includes:
 - Parsing links from CSS files, and from CSS content found in HTML
   style tags and attributes.
 - Supporting conversion of links found within CSS content, when
   --convert-links is specified.
 - Ensuring that CSS files end in the ".css" filename extension,
   when --convert-links is specified.

Ответ 2

Это можно сделать через Firefox, см. эту форму

  • Щелкните правой кнопкой мыши
  • Просмотр информации о странице
  • Выберите вкладку мультимедиа
  • Выделите все файлы
  • Сохранить как

Ссылка - http://www.webdeveloper.com/forum/showthread.php?t=212610

Ответ 3

wget - отличный выбор для вас. Просто для получения дополнительной информации, версия wget на окнах в это время отсутствует официальная версия gnu для версии wget версии 1.12. Текущая версия - 1.11

wget version 1.11 не может загружать изображения/шрифты в css файлы. К счастью, вы можете найти сборку 1.14 с этой страницы. Он исправил эти проблемы.

http://opensourcepack.blogspot.com/2010/05/wget-112-for-windows.html

Ответ 4

Я столкнулся с той же проблемой на днях, работая с клиентом. Другим инструментом, который работает очень хорошо, является HTTrack. Программное обеспечение доступно в режиме командной строки для обоих окон и Linux. Для Linux они предварительно создали пакеты для большинства наиболее распространенных операционных систем, найденных здесь

В моих целях он работал лучше, чем wget с некоторыми добавленными функциями/переключателями, которые фиксируют ссылки внутри html файла.

Ответ 5

Текущая версия Opera (12) позволяет сохранить страницу как "HTML с изображениями".

Таким образом, Opera также загружает изображения, на которые ссылаются в файлах CSS, и соответственно адаптирует URL-адреса изображений в CSS.

Ответ 6

В Firefox:

Файл- > Сохранить страницу как- > веб-страницу, заполните

Сохраняет все javascript и изображения и css. Больше ничего не требуется:)

Ответ 7

wget