Я пытаюсь получить каждую внешнюю ссылку веб-страницы с помощью Ruby. Я использую String.scan
с этим регулярным выражением:
/href="#" onclick="location.href='https?:[^'; return false;"]*|href='https?:[^']*/i
Затем я могу использовать gsub для удаления части href:
str.gsub(/href=['"]/)
Это отлично работает, но я не уверен, насколько он эффективен с точки зрения производительности. Это нормально использовать, или я должен работать с более конкретным парсером (например, nokogiri)? Какой способ лучше?
Спасибо!