Я хочу извлечь текст из следующего src тега изображения и текста тега привязки, который находится внутри данных класса div.
Я успешно удаляю img src, но у меня возникают проблемы с извлечением текста из тега привязки.
<a class="title" href="#" onclick="location.href='http://rads.stackoverflow.com/amzn/click/B0073HSK0K'; return false;">Nikon COOLPIX L26 16.1 MP Digital Camera with 5x Zoom NIKKOR Glass Lens and 3-inch LCD (Red)</a>
Вот ссылка на всю HTML-страницу
Вот мой код
for div in soup.findAll('div', attrs={'class':'image'}):
print "\n"
for data in div.findNextSibling('div', attrs={'class':'data'}):
for a in data.findAll('a', attrs={'class':'title'}):
print a.text
for img in div.findAll('img'):
print img['src']
То, что я пытаюсь сделать, - извлечь изображение src (link) и заголовок в стороне из div class= data.
например,
<a class="title" href="#" onclick="location.href='http://rads.stackoverflow.com/amzn/click/B0073HSK0K'; return false;">Nikon COOLPIX L26 16.1 MP Digital Camera with 5x Zoom NIKKOR Glass Lens and 3-inch LCD (Red)</a>
Я хочу извлечь: Nikon COOLPIX L26 16.1 MP Digital Camera with 5x Zoom NIKKOR Glass Lens and 3-inch LCD (Red)