Мне нужно преобразовать текст разметки в текстовый формат, чтобы отобразить сводку на моем веб-сайте. Я хочу код в python.
Python: как конвертировать отформатированный текст в текст
Ответ 1
Этот модуль поможет вам описать:
http://www.freewisdom.org/projects/python-markdown/Using_as_a_Module
После того, как вы изменили уценку на HTML, вы можете использовать анализатор HTML, чтобы вырезать простой текст.
Ваш код может выглядеть примерно так:
from BeautifulSoup import BeautifulSoup
from markdown import markdown
html = markdown(some_html_string)
text = ''.join(BeautifulSoup(html).findAll(text=True))
Ответ 2
Прокомментировал и удалил его, потому что, наконец, я думаю, что вижу, как он выглядит здесь: может быть проще преобразовать ваш текст разметки в HTML и удалить HTML из текста. Я не знаю ничего, чтобы эффективно удалить уценку из текста, но есть много HTML-решений для обычного текста.