Я только начинаю в Perl и написал простой script, чтобы сделать некоторые веб-скребки. Я использую WWW:: Mechanize и HTML:: TreeBuilder, чтобы выполнить большую часть работы, но у меня возникли проблемы. У меня есть следующий HTML:
<table class="winsTable">
<thead>...</thead>
<tbody>
<tr>
<td class = "wins">15</td>
</tr>
</tbody>
</table>
Я знаю, что есть некоторые модули, которые получают данные из таблиц, но это особый случай; не все данные, которые я хочу, находятся в таблице. Итак, я попробовал:
my $tree = HTML::TreeBuilder->new_from_url( $url );
my @data = $tree->find('td class = "wins"');
Но @data
возвращается пустым. Я знаю, что этот метод будет работать без имени класса, потому что я успешно проанализировал данные с помощью $tree->find('strong')
. Итак, есть ли модуль, который может обрабатывать этот тип синтаксиса HTML? Я просмотрел документацию HTML:: TreeBuilder и не нашел ничего, что появилось, но я мог ошибаться.