Я пытаюсь извлечь текст из pdf и записать его в json файл. При извлечении символов Юникода Json преобразует все и в \u0026. Например, моя фактическая строка ش
. (который представляет ش). Он правильно печатает файл .txt, консоль и т.д. Но когда я пытаюсь напечатать эту строку в Json файле, она показывает \u0026#1588;
.
Я использую Java, а код
Gson gson = new Gson();
String json = gson.toJson(pdfDoc);
Примечание. pdfDoc
- это объект, содержащий все детали (положение, цвет, шрифт и т.д.) символов внутри входного документа PDF. Я использую gson-2.2.1.jar
.