Como faço para enviar org.w3c.dom.Element para formato de string em java?

90

Eu tenho um org.w3c.dom.Elementobjeto passado em meu método. Preciso ver toda a string xml, incluindo seus nós filhos (todo o gráfico do objeto). Estou procurando um método que possa converter Elementem uma string de formato xml que eu possa System.out.printlnusar. Apenas println()no objeto 'Elemento' não funcionará porque toString()não produzirá o formato xml e não passará por seu nó filho. Existe uma maneira fácil de fazer isso sem escrever meu próprio método? Obrigado.

Doug Porter
fonte

Respostas:

156

Supondo que você queira manter a API padrão ...

Você pode usar um DOMImplementationLS :

Document document = node.getOwnerDocument();
DOMImplementationLS domImplLS = (DOMImplementationLS) document
    .getImplementation();
LSSerializer serializer = domImplLS.createLSSerializer();
String str = serializer.writeToString(node);

Se a declaração <? Xml version = "1.0" encoding = "UTF-16"?> O incomoda, você pode usar um transformador :

TransformerFactory transFactory = TransformerFactory.newInstance();
Transformer transformer = transFactory.newTransformer();
StringWriter buffer = new StringWriter();
transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
transformer.transform(new DOMSource(node),
      new StreamResult(buffer));
String str = buffer.toString();
McDowell
fonte
7
Esta é a solução se você está obtendo [html: null] e espera o HTML. Adicionado este comentário para que o Google possa indexar a resposta com esperança.
Donal Tobin
3
Você ainda pode usar o LSSerializer e gerar "UTF-8". Use LSOutput com StringWriter e defina o tipo de codificação para "UTF- * 8"
ricosrealm
1
Também funciona com o objeto w3c Document
terceiro
2
<?xml version="1.0" encoding="UTF-16"?>declaração incomoda ... também podemos adicionar esta linha serializer .getDomConfig().setParameter("xml-declaration", false); na primeira solução ....
Tarsem Singh
obrigado pela sua resposta, isso é muito bom. Mas eu tenho um problema com isso, às vezes algumas tags das partes correspondentes são removidas e o conteúdo de texto delas é exibido apenas. Você tem alguma sugestão para este problema?
epcpu
16

Código simples de 4 linhas para obter String sem declaração xml ( <?xml version="1.0" encoding="UTF-16"?>) deorg.w3c.dom.Element

DOMImplementationLS lsImpl = (DOMImplementationLS)node.getOwnerDocument().getImplementation().getFeature("LS", "3.0");
LSSerializer serializer = lsImpl.createLSSerializer();
serializer.getDomConfig().setParameter("xml-declaration", false); //by default its true, so set it to false to get String without xml-declaration
String str = serializer.writeToString(node);
Tarsem Singh
fonte
2

Não compatível com a API JAXP padrão, usei a biblioteca JDom para essa finalidade. Tem uma função de impressora, opções de formatador, etc. http://www.jdom.org/

Karl
fonte
+1 por não ser a intenção da API org.w3c.dom padrão. Se estou interessado em blocos de XML como texto, geralmente tento analisá-lo como texto com uma correspondência de regex (se os critérios de pesquisa forem facilmente representados como um regex).
Cornel Masson
2

Se você tiver o esquema do XML ou puder criar ligações JAXB para ele, poderá usar o JAXB Marshaller para gravar em System.out:

import javax.xml.bind.*;
import javax.xml.bind.annotation.*;
import javax.xml.namespace.QName;

@XmlRootElement
public class BoundClass {

    @XmlAttribute
    private String test;

    @XmlElement
    private int x;

    public BoundClass() {}

    public BoundClass(String test) {
        this.test = test;
    }

    public static void main(String[] args) throws Exception {
        JAXBContext jxbc = JAXBContext.newInstance(BoundClass.class);
        Marshaller marshaller = jxbc.createMarshaller();
        marshaller.setProperty(Marshaller.JAXB_FRAGMENT, true);
        marshaller.marshal(new JAXBElement(new QName("root"),BoundClass.class,new Main("test")),System.out);
    }
}
wierob
fonte
2

Experimente jcabi-xml com um liner:

String xml = new XMLDocument(element).toString();
Yegor256
fonte
Novas versões de jcabi-xml não suportam Element como param, apenas Node / File / String.
Ermintar
1

isso é o que é feito em jcabi:

private String asString(Node node) {
    StringWriter writer = new StringWriter();
    try {
        Transformer trans = TransformerFactory.newInstance().newTransformer();
        // @checkstyle MultipleStringLiterals (1 line)
        trans.setOutputProperty(OutputKeys.INDENT, "yes");
        trans.setOutputProperty(OutputKeys.VERSION, "1.0");
        if (!(node instanceof Document)) {
            trans.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
        }
        trans.transform(new DOMSource(node), new StreamResult(writer));
    } catch (final TransformerConfigurationException ex) {
        throw new IllegalStateException(ex);
    } catch (final TransformerException ex) {
        throw new IllegalArgumentException(ex);
    }
    return writer.toString();
}

E funciona para mim!

thunderhawk
fonte
0

Com VTD-XML , você pode passar para o cursor e fazer uma única chamada getElementFragment para recuperar o segmento (conforme indicado por seu deslocamento e comprimento) ... Abaixo está um exemplo

import com.ximpleware.*;
public class concatTest{
    public static void main(String s1[]) throws Exception {
        VTDGen vg= new VTDGen();
        String s = "<users><user><firstName>some </firstName><lastName> one</lastName></user></users>";
        vg.setDoc(s.getBytes());
        vg.parse(false);
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/users/user/firstName");
        int i=ap.evalXPath();
        if (i!=1){
            long l= vn.getElementFragment();
            System.out.println(" the segment is "+ vn.toString((int)l,(int)(l>>32)));
        }
    }

}
vtd-xml-author
fonte