Я подумываю попробовать Beautiful Soup, пакет Python для очистки HTML. Есть ли еще какие-то HTML файлы для очистки, на которые я должен смотреть? Python не является требованием, мне действительно интересно узнать о других языках.
История до сих пор:
- Python
- Рубин
- .NET
- Perl
- Java
- JavaScript
- PHP
- Большинство из них