Я пишу приложение для блогов с Django. Я хочу, чтобы авторы комментариев использовали некоторые теги (например, <strong>
, a
и т.д.), Но отключили все остальные.
Кроме того, я хочу, чтобы они помещали код в <code> теги и обрабатывают их.
Например, кто-то может написать этот комментарий:
I like this article, but the third code example <em>could have been simpler</em>:
<code lang="c">
#include <stdbool.h>
#include <stdio.h>
int main()
{
printf("Hello World\n");
}
</code>
Проблема заключается в том, что когда я разбираю комментарий с помощью BeautifulSoup для удаления запрещенных тегов HTML, он также анализирует внутренности кода <code> блоки и обрабатывает < stdbool.h > и < stdio.h > как если бы они были тегами HTML.
Как я могу сказать BeautifulSoup не анализировать <code> блоки? Может быть, есть другие синтаксические анализаторы HTML для этой работы?