Я очищаю страницу с помощью pookon pyquery, и я смущен теми типами, которые она возвращает, и, в частности, как перебирать список результатов.
Если мой HTML выглядит примерно так:
<div class="formwrap">blah blah <h3>Something interesting</h3></div>
<div class="formwrap">more rubbish <h3>Something else interesting</h3></div>
Как получить внутри тегов <h3>
один за другим, чтобы я мог их обработать? Я пытаюсь:
results_page = pq(response.read())
formwraps = results_page(".formwrap")
print type(formwraps)
print type([formwraps])
for my_div in [formwraps]:
print type(my_div)
print my_div("h3").text()
Это дает:
<class 'pyquery.pyquery.PyQuery'>
<type 'list'>
<class 'pyquery.pyquery.PyQuery'>
Something interesting something else interesting
Похоже, что никакой реальной итерации не происходит. Как я могу вытащить каждый элемент отдельно?
Дополнительный вопрос от новичка: какие квадратные скобки вокруг [a]
делают? Похоже, он преобразует специальный объект Pyquery в список. Является ли []
стандартным оператором Python?
------ ОБНОВЛЕНИЕ --------