Как передавать XML-данные с помощью XOM?

Скажем, я хочу вывести огромный набор результатов поиска, как XML, в PrintWriter или OutputStream, используя XOM. Полученный XML будет выглядеть так:

<?xml version="1.0" encoding="UTF-8"?>
<resultset>
    <result>
       [child elements and data]
    </result>
    ...
    ...
    [1000s of result elements more]
</resultset>

Поскольку результирующий XML-документ может быть большим (возможно, сотнями мегабайт), я хочу вывести его потоковым способом (вместо создания всего документа в памяти и последующего его написания).

Гранулярность вывода одного <result> за раз в порядке, поэтому я хочу сгенерировать один <result> за другим и записать его в поток. Другими словами, я просто хотел бы сделать что-то вроде этого псевдокода (автоматическая промывка включена, поэтому не беспокойтесь об этом):

open stream/writer
write declaration
write start tag for <resultset>
while more results:
    write next <result> element
write end tag for <resultset> 
close stream/writer

Я смотрел Serializer, но необходимые методы writeStartTag(Element), writeEndTag(Element), write(DocType) защищены, а не публично! Нет ли другого способа, кроме подкласса Serializer, чтобы использовать эти методы или вручную записывать начальные и конечные теги непосредственно в поток как строки, минуя XOM вообще? (Последнее не так уж плохо в этом простом примере, но в общем случае оно получилось бы довольно уродливым.)

Я что-то пропустил или просто не сделал для этого XOM?

С dom4j Я мог бы сделать это легко, используя XMLWriter - у него есть конструкторы, которые принимают Writer или OutputStream, а методы writeOpen(Element), writeClose(Element), writeDocType(DocumentType) и т.д. Сравните с XOM Serializer, где единственный общедоступный метод write это тот, который принимает целое Document.

(Это связано с моим вопросом о лучшей замене dom4j, где XOM является сильным соперником.)

Ответ 1

Я столкнулся с той же проблемой, но нашел довольно простым сделать то, что вы упомянули в качестве опции и подкласса Serializer следующим образом:

public class StreamSerializer extends Serializer {

    public StreamSerializer(OutputStream out) {
        super(out);
    }

    @Override
    public void write(Element element) throws IOException {
        super.write(element);
    }

    @Override
    public void writeXMLDeclaration() throws IOException {
        super.writeXMLDeclaration();
    }

    @Override
    public void writeEndTag(Element element) throws IOException {
        super.writeEndTag(element);
    }

    @Override
    public void writeStartTag(Element element) throws IOException {
        super.writeStartTag(element);
    }

}

Затем вы все равно можете использовать различные конфигурации XOM, такие как setIdent и т.д., но используйте его следующим образом:

Element rootElement = new Element("resultset");
StreamSerializer serializer = new StreamSerializer(out);
serializer.setIndent(4);
serializer.writeXMLDeclaration();
serializer.writeStartTag(rootElement);
while(hasNextElement()) {
    serializer.write(nextElement());
}
serializer.writeEndTag(rootElement);
serializer.flush();

Ответ 2

Насколько я знаю, XOM не поддерживает потоковое воспроизведение напрямую.

То, что я использовал, когда захотелось передать свои XML-документы, было NUX, который имеет потоковый XML-сериализатор, аналогичный стандартным классам Serializer в XOM. NUX совместим с XOM. Я загрузил источники NUX, извлек несколько классов NUX (интерфейс StreamingSerializer, StreamingXMLSerializer - который работает для документов XOM, StreamingVerifier и NamespacesInScope), поместил их в мой проект и работает как шарм. Жаль, что это не прямо в XOM: - (

NUX очень хороший компаньон для XOM: http://acs.lbl.gov/software/nux/, рабочее зеркало скачать: nux-1.6.tar.gz

Ссылка на API: http://acs.lbl.gov/software/nux/api/nux/xom/io/StreamingSerializer.html

Вот пример кода (методы вызывают в порядке: start(), n * nextResult(), finish(), сериализатор - StreamingXMLSerializer из NUX):

void start() {
    serializer.writeXMLDeclaration();

    Element root = new Element("response");
    root.addAttribute(new Attribute("found", Integer.toString(123)));
    root.addAttribute(new Attribute("count", Integer.toString(542)));

    serializer.writeStartTag(root);

    serializer.flush();
}

void nextResult(Result result) {
    Element element = result.createXMLRepresentation();
    serializer.write(element);
    serializer.flush();
}

void finish() {
    serializer.writeEndTag();
    serializer.flush();
}