Возможный дубликат:
Beautiful Soup не может найти класс CSS, если у объекта есть и другие классы
Я использую BeautifulSoup для поиска tables
в HTML. Проблема, с которой я сейчас сталкиваюсь, заключается в использовании пробелов в атрибуте class
. Если мой HTML читает <html><table class="wikitable sortable">blah</table></html>
, я не могу извлечь его из следующего (где я должен был бы найти tables
как с wikipedia
, так и wikipedia sortable
для class
):
BeautifulSoup(html).findAll(attrs={'class':re.compile("wikitable( sortable)?")})
Это найдет таблицу, если мой HTML только <html><table class="wikitable">blah</table></html>
. Аналогично, я попытался использовать "wikitable sortable"
в своем регулярном выражении, и это тоже не будет соответствовать. Любые идеи?