Извините, если это простой вопрос, я до сих пор довольно новичок в этом, но я потратил некоторое время на поиск ответа и ничего не нашел. У меня есть список, который похож на этот ужасный беспорядок:
['Organization name} ', '> (777) 777-7777} ', ' class="lsn-mB6 adr">1 Address, MA 02114 } ', ' class="lsn-serpListRadius lsn-fr">.2 Miles} MORE INFO YOUR LISTING MAP if (typeof(serps) !== \'undefined\') serps.arrArticleIds.push(\'4603114\'); ', 'Other organization} ', '> (555) 555-5555} ', ' class="lsn-mB6 adr">301 Address, MA 02121 } ', ' class="lsn-serpListRadius lsn-fr">.2 Miles} MORE INFO CLAIM YOUR LISTING MAP if (typeof(serps) !== \'undefined\') serps.arrArticleIds.push(\'4715945\'); ', 'Organization} ']
И мне нужно обработать его, чтобы HTML.py мог превратить информацию в нее в таблицу. По какой-то причине HTML.py просто не может обрабатывать элементы монстра (например, class= "lsn-serpListRadius lsn-fr" > . 2 мили} ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ ВАШЕЙ ЛИСТИНГОВОЙ КАРТЫ if (typeof (serps)! ==\'undefined \') serps.arrArticleIds.push(\ '4603114 \'); 'и т.д.). К счастью для меня, я действительно не забочусь об информации в элементах монстра и хочу избавиться от них.
Я попробовал написать регулярное выражение, которое соответствовало бы всем более чем двухбуквенным буквам all-caps, чтобы идентифицировать элементы монстров и получило следующее:
re.compile('[^a-z]*[A-Z][^a-z]*\w{3,}')
Но я не знаю, как применить это к удалению элементов, содержащих совпадения, с этим регулярным выражением из списка. Как я могу это сделать, это правильный способ сделать это?