Я пытаюсь получить элементы "ссылки" с определенных веб-страниц. Я не могу понять, что я делаю неправильно. Я получаю следующую ошибку:
Уровень важности: предупреждение
Сообщение: DOMDocument:: loadHTML() [domdocument.loadhtml]: htmlParseEntityRef: нет имени в Entity, строка: 536
Имя файла: controllers/test.php
Номер строки: 34
В коде приведена строка 34:
$dom->loadHTML($html);
мой код:
$url = "http://www.amazon.com/";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
if($html = curl_exec($ch)){
// parse the html into a DOMDocument
$dom = new DOMDocument();
$dom->recover = true;
$dom->strictErrorChecking = false;
$dom->loadHTML($html);
$hrefs = $dom->getElementsByTagName('a');
echo "<pre>";
print_r($hrefs);
echo "</pre>";
curl_close($ch);
}else{
echo "The website could not be reached.";
}