Довольно печатный вывод из javax.xml.transform.Transformer с использованием только стандартного java-api (позиционирования и позиционирования Doctype)

Используя следующий простой код:

package test;

import java.io.*;
import javax.xml.transform.*;
import javax.xml.transform.stream.*;

public class TestOutputKeys {
    public static void main(String[] args) throws TransformerException {

        // Instantiate transformer input
        Source xmlInput = new StreamSource(new StringReader(
                "<!-- Document comment --><aaa><bbb/><ccc/></aaa>"));
        StreamResult xmlOutput = new StreamResult(new StringWriter());

        // Configure transformer
        Transformer transformer = TransformerFactory.newInstance()
                .newTransformer(); // An identity transformer
        transformer.setOutputProperty(OutputKeys.DOCTYPE_SYSTEM, "testing.dtd");
        transformer.setOutputProperty(OutputKeys.INDENT, "yes");
        transformer.transform(xmlInput, xmlOutput);

        System.out.println(xmlOutput.getWriter().toString());
    }

}

Я получаю вывод:

<?xml version="1.0" encoding="UTF-8"?>
<!-- Document comment --><!DOCTYPE aaa SYSTEM "testing.dtd">

<aaa>
<bbb/>
<ccc/>
</aaa>

Вопрос A: Тег doctype появляется после комментария документа. Возможно ли сделать это перед комментарием документа?

Вопрос B: Как достичь отступов, используя только API JavaSE 5.0? Этот вопрос по существу идентичен Как красиво печатать xml из java, однако почти все ответы в этом вопросе зависят от внешних библиотек. Единственный применимый ответ (отправленный пользователем по имени Lorenzo Boccaccia), который использует только java api, в основном равен приведенному выше коду, но не работает для меня (как показано на выходе, я не получаю отступов).

Я предполагаю, что вам нужно задать количество пробелов для отступов, так как многие ответы с внешними библиотеками, но я просто не могу найти, где указать это в java api. Учитывая тот факт, что в java-api существует возможность установить свойство "отступы", должно быть возможно каким-то образом выполнить отступ. Я просто не могу понять, как.

Ответ 1

Недопустимая часть - это сумма в отступ. Вы можете указать размер отступа и отступов следующим образом:

transformer.setOutputProperty(OutputKeys.INDENT, "yes");
transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "2");
transformer.transform(xmlInput, xmlOutput);

Ответ 2

Немного использовать класс в качестве примера...

import org.apache.xml.serialize.XMLSerializer;

public class XmlUtil {

public static Document file2Document(File file) throws Exception {
    if (file == null || !file.exists()) {
        throw new IllegalArgumentException("File must exist![" + file == null ? "NULL"
                : ("Could not be found: " + file.getAbsolutePath()) + "]");
    }
    DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
    dbFactory.setNamespaceAware(true);
    return dbFactory.newDocumentBuilder().parse(new FileInputStream(file));
}

public static Document string2Document(String xml) throws Exception {
    InputSource src = new InputSource(new StringReader(xml));
    DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
    dbFactory.setNamespaceAware(true);
    return dbFactory.newDocumentBuilder().parse(src);
}

public static OutputFormat getPrettyPrintFormat() {
    OutputFormat format = new OutputFormat();
    format.setLineWidth(120);
    format.setIndenting(true);
    format.setIndent(2);
    format.setEncoding("UTF-8");
    return format;
}

public static String document2String(Document doc, OutputFormat format) throws Exception {
    StringWriter stringOut = new StringWriter();
    XMLSerializer serial = new XMLSerializer(stringOut, format);
    serial.serialize(doc);
    return stringOut.toString();
}

public static String document2String(Document doc) throws Exception {
    return XmlUtil.document2String(doc, XmlUtil.getPrettyPrintFormat());
}

public static void document2File(Document doc, File file) throws Exception {
    XmlUtil.document2String(doc, XmlUtil.getPrettyPrintFormat());
}

public static void document2File(Document doc, File file, OutputFormat format) throws Exception {
    XMLSerializer serializer = new XMLSerializer(new FileOutputStream(file), format);
    serializer.serialize(doc);
}
}

XMLserializer предоставляется xeresImpl. Вот зависимость maven:

<dependency>
    <groupId>xerces</groupId>
    <artifactId>xercesImpl</artifactId>
    <version>2.11.0</version>
</dependency>

Вы можете найти зависимость для своего любимого инструмента сборки здесь: http://mvnrepository.com/artifact/xerces/xercesImpl/2.11.0.

Ответ 3

Вы могли бы, вероятно, преувеличить все с помощью XSLT файла. Google выдает несколько результатов, но я не могу прокомментировать их правильность.

Ответ 4

Чтобы сделать вывод допустимым XML-документом, NO. Действительный документ XML должен начинаться с инструкции обработки. Подробнее см. В спецификации XML http://www.w3.org/TR/REC-xml/#sec-prolog-dtd.