У меня есть следующий (упрощенный) код, который использует следующий источник:
<html>
<p>line 1</p>
<div>
<a>line 2</a>
</div>
</html>
soup = BeautifulSoup('<html><p>line 1</p><div><a>line 2</a></div></html>')
ele = soup.find('p').nextSibling
somehow_print_tag_of_ele_here
Я хочу получить тег ele, в данном случае "div". Тем не менее, я только, кажется, могу получить тег своих детей. Я что-то пропустил? Я думал, что могу сделать ele.tag.name, но это исключение, поскольку тег - None.
#Below correctly prints the div element "<div><a>line 2</a></div>"
print ele
#Below prints "None". Printing tag.name is an exception since tag is None
print ele.tag
#Below prints "a", the child of ele
allTags = ele.findAll(True)
for e in allTags:
print e.name
На данный момент я подумываю о том, чтобы сделать что-то по пути получения родительского элемента ele, а затем получить метки родительских детей и, подсчитав, сколько элементеров старших братьев и сестер имеет счет, вернувшись к правильному дочернему тегу. Это кажется смешным.