Я использовал этот метод для извлечения веб-страницы в объект org.jsoup.nodes.Document
:
myDoc = Jsoup.connect(myURL).ignoreContentType(true).get();
Как мне записать этот объект в файл HTML? Методы myDoc.html()
, myDoc.text()
и myDoc.toString()
не выводят все элементы документа.
Некоторая информация в элементе javascript может быть потеряна при его анализе. Например, "timestamp" в источнике медиа-страницы Instagram.