Я пытаюсь получить значение из HTML-страницы, используя библиотеку HTML-Python. Значение, которое я хочу получить, находится внутри этого элемента html:
...
<div id="remository">20</div>
...
Это мой класс HTMLParser:
class LinksParser(HTMLParser.HTMLParser):
def __init__(self):
HTMLParser.HTMLParser.__init__(self)
self.seen = {}
def handle_starttag(self, tag, attributes):
if tag != 'div': return
for name, value in attributes:
if name == 'id' and value == 'remository':
#print value
return
def handle_data(self, data):
print data
p = LinksParser()
f = urllib.urlopen("http://domain.com/somepage.html")
html = f.read()
p.feed(html)
p.close()
Может ли кто-нибудь указать мне в правильном направлении? Я хочу, чтобы функциональность класса получала значение 20.