Я хочу извлечь пару ссылок из html-страницы, загруженной из Интернета, я думаю, что использование linq для XML было бы хорошим решением для моего дела.
Моя проблема в том, что я не могу создать XmlDocument из HTML, используя Load (string url), не работал, поэтому я загрузил html в строку, используя:
public static string readHTML(string url)
{
HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse res = (HttpWebResponse)req.GetResponse();
StreamReader sr = new StreamReader(res.GetResponseStream());
string html = sr.ReadToEnd();
sr.Close();
return html;
}
Когда я пытаюсь загрузить эту строку с помощью LoadXml (string xml), я получаю исключение
'--' is an unexpected token. The expected token is '>'
Какой способ следует использовать для чтения html файла для анализируемого XML