Надеюсь, этот вопрос не является RTFM.
Я пытаюсь написать Python script, который извлекает ссылки со стандартной HTML-страницы (теги <link href...
).
Я искал в Интернете для соответствия regexen и нашел много разных шаблонов. Есть ли согласованное стандартное регулярное выражение для соответствия ссылкам?
Адам
UPDATE: Я действительно ищу два разных ответа:
- Что такое библиотечное решение для синтаксического анализа ссылок HTML. Beautiful Soup кажется хорошим решением (спасибо,
Igal Serban
иcletus
!) - Можно ли определить ссылку с помощью регулярного выражения?