Я очищаю текст из нежелательных HTML-тегов (например, <script>) с помощью
String clean = Jsoup.clean(someInput, Whitelist.basicWithImages());
Проблема заключается в том, что она заменяет, например, å на å (что вызывает проблемы для меня, поскольку это не "чистый xml" ).
Например
Jsoup.clean("hello å <script></script> world", Whitelist.basicWithImages())
дает
"hello å world"
но я хотел бы
"hello å world"
Есть ли простой способ достичь этого? (Т.е. проще, чем преобразование å назад в å в результате.)