У меня есть функция CouchDB view map, которая генерирует реферат сохраненного HTML-документа (первые x
символы текста). К сожалению, у меня нет среды браузера для преобразования HTML в обычный текст.
В настоящее время я использую это многоступенчатое регулярное выражение
html.replace(/<style([\s\S]*?)<\/style>/gi, ' ')
.replace(/<script([\s\S]*?)<\/script>/gi, ' ')
.replace(/(<(?:.|\n)*?>)/gm, ' ')
.replace(/\s+/gm, ' ');
в то время как это очень хороший фильтр, он, очевидно, не идеальный, и некоторые остатки иногда проскальзывают. Есть ли лучший способ конвертировать в обычный текст без среды браузера?