Python: как конвертировать отформатированный текст в текст

Мне нужно преобразовать текст разметки в текстовый формат, чтобы отобразить сводку на моем веб-сайте. Я хочу код в python.

Ответ 1

Этот модуль поможет вам описать:

http://www.freewisdom.org/projects/python-markdown/Using_as_a_Module

После того, как вы изменили уценку на HTML, вы можете использовать анализатор HTML, чтобы вырезать простой текст.

Ваш код может выглядеть примерно так:

from BeautifulSoup import BeautifulSoup
from markdown import markdown

html = markdown(some_html_string)
text = ''.join(BeautifulSoup(html).findAll(text=True))

Ответ 2

Прокомментировал и удалил его, потому что, наконец, я думаю, что вижу, как он выглядит здесь: может быть проще преобразовать ваш текст разметки в HTML и удалить HTML из текста. Я не знаю ничего, чтобы эффективно удалить уценку из текста, но есть много HTML-решений для обычного текста.