Учитывая ссылку HTML, например
<a href="urltxt" class="someclass" close="true">texttxt</a>
как я могу выделить URL и текст?
Обновление
Я использую Beautiful Soup и не могу понять, как это сделать.
Я сделал
soup = BeautifulSoup.BeautifulSoup(urllib.urlopen(url))
links = soup.findAll('a')
for link in links:
print "link content:", link.content," and attr:",link.attrs
я получаю
*link content: None and attr: [(u'href', u'_redirectGeneric.asp?genericURL=/root /support.asp')]* ...
...
Почему мне не хватает содержимого?
edit: выработано "застряло" в соответствии с рекомендациями:)