Как указано в названии. Мне нужно вернуть весь контент в тегах тела html-документа, включая любые последующие тэги html и т.д. Мне любопытно узнать, что лучший способ сделать это. У меня было рабочее решение с пакетом Gokogiri, однако я стараюсь держаться подальше от любых пакетов, зависящих от библиотек C. Есть ли способ сделать это с помощью стандартной библиотеки? или с пакетом, который на 100% уходит?
После публикации моего первоначального вопроса я попытался использовать следующие пакеты, которые не дали никакого разрешения. (Ни один из них, похоже, не возвращает последующих детей или вложенные теги изнутри тела. Например:
<!DOCTYPE html>
<html>
<head>
<title>
Title of the document
</title>
</head>
<body>
body content
<p>more content</p>
</body>
</html>
будет возвращать содержимое тела, игнорируя последующие теги <p>
и текст, который они обертывают):
- pkg/encoding/xml/(стандартная библиотека xml-пакета)
- golang.org/x/net/html
По всей цели было бы получить строку или контент, который будет выглядеть так:
<body>
body content
<p>more content</p>
</body>