Мы используем Jsoup.clean(String, Whitelist) для обработки некоторого ввода, и кажется, что Jsoup добавляет посторонний разрыв строки непосредственно перед допустимыми тегами. Я видел, как некоторые люди публикуют эту проблему в Интернете, но не смогли найти решение.
Например, допустим, у нас есть очень простая строка с выделенными в ней жирными тегами, например:
String htmlToClean = "This is a line with <b>bold text</b> within it."
String returnString = Jsoup.clean(htmlToClean, Whitelist.relaxed());
System.out.println(returnString);
Что происходит из вызова метода clean(), это примерно так:
This is a line with \n<b>bold text</b> within it.
Обратите внимание, что посторонний "\n" добавлен непосредственно перед открытием жирным тегом. Я не могу отследить источник, в который он добавлен (хотя, по общему признанию, я новичок в Jsoup).
Кто-нибудь столкнулся с этой проблемой, и еще лучше, нашел способ избежать этого лишнего, нежелательного персонажа, который будет добавлен к строке таким образом?