При попытке разобрать html с использованием языка запросов Yahoo и возможностей xpath, предоставляемых YQL, я столкнулся с проблемами неспособности извлечь "text()" или значения атрибута.
Например,
perma link
select * from html where url="http://stackoverflow.com"
and xpath='//div/h3/a'
дает список якорей как xml
<results>
<a class="question-hyperlink" href="/info/661184/filling-the-text-area-with-the-text-when-a-button-is-clicked" title="In ASP.net, I need the code to fill the text area (in the form) when a button is clicked. Can you help me through by showing a simple .aspx code containing the script tag? ">Filling the text area with the text when a button is clicked</a>...
</results>
Теперь, когда я пытаюсь извлечь значение node, используя
select * from html where url="http://stackoverflow.com"
and xpath='//div/h3/a/text()'
Я получаю конкатенированные результаты, а не список node например
<results>Xcode: attaching to a remote process for debuggingWhy is b
…… </results>
Как я могу разделить его на node списки и как мне выбрать значения атрибута?
Запрос вроде этого
select * from html where url="http://stackoverflow.com"
and xpath='//div/h3/a[@href]'
дал мне те же результаты для запроса div/h3/a