Мне нужен шаблон регулярного выражения для поиска ссылок на веб-страницы в HTML.
Сначала я использую @"(<a.*?>.*?</a>)" для извлечения ссылок (<a>), но я не могу извлечь из него href.
Мои строки:
-
<a href="www.example.com/page.php?id=xxxx&name=yyyy" ....></a> -
<a href="#" onclick="location.href='http://www.example.com/page.php?id=xxxx&name=yyyy'; return false;" ....></a> -
<a href="#" onclick="location.href='https://www.example.com/page.php?id=xxxx&name=yyyy'; return false;" ....></a> -
<a href="www.example.com/page.php/404" ....></a>
1, 2 и 3 действительны, и они мне нужны, но номер 4 для меня недействителен
(? и = существенно)
Спасибо всем, но мне не нужен синтаксический анализ <a>. У меня есть список ссылок в формате href="abcdef".
Мне нужно получить href ссылок и отфильтровать его, мои любимые URL должны содержать ? и = как page.php?id=5
Спасибо!