合并文档,同时保留xsi:type

问题描述

| 我有2个文档对象,其中的文档包含相似的XML \。例如:
<tt:root xmlns:tt=\"http://myurl.com/\">
  <tt:child/>
  <tt:child/>
</tt:root>
而另一个
<ns1:root xmlns:ns1=\"http://myurl.com/\" xmlns:ns2=\"http://myotherurl.com/\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\">
  <ns1:child/>
  <ns1:child xsi:type=\"ns2:SomeType\"/>
</ns1:root>
我需要将它们合并到具有1个根元素和4个子元素的1个文档中。 问题是,如果我使用
document.importNode
函数进行合并,它将正确处理BUT xsi:type元素处的命名空间。因此,我得到的结果是:
<tt:root xmlns:tt=\"http://myurl.com/\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\">
  <tt:child/>
  <tt:child/>
  <ns1:child xmlns:ns1=\"http://myurl.com/\"/>
  <ns1:child xmlns:ns1=\"http://myurl.com/\" xsi:type=\"ns2:SomeType\"/>
</tt:root>
如您所见,ns2在
xsi:type
中使用,但未在任何地方定义。有没有自动方法解决这个问题? 谢谢。 添加: 如果使用认的Java DOM库无法完成此任务,那么也许可以使用其他一些库来完成任务?     

解决方法

        XQuery的单行代码可以完成此工作:构造一个名为context root元素的新节点,然后将其子项与其他文档中的子项一起导入:
declare variable $other external; element {node-name(*)} {*/*,$other/*/*}
尽管在XQuery中您无法完全控制名称空间节点(至少在XQuery 1.0中),但是它具有
copy-namespaces
模式设置,可用于要求保持名称空间上下文完整,以防实现默认保留它。 如果XQuery是一个可行的选项,则saxon9he.jar可能是您追求的“神奇xml库”。 以下是使用s9api API公开一些上下文的示例代码:
import javax.xml.parsers.DocumentBuilderFactory;
import net.sf.saxon.s9api.*;
import org.w3c.dom.Document;

...

  Document merge(Document context,Document other) throws Exception
  {
    Processor processor = new Processor(false);
    XQueryExecutable executable = processor.newXQueryCompiler().compile(
      \"declare variable $other external; element {node-name(*)} {*/*,$other/*/*}\");
    XQueryEvaluator evaluator = executable.load();    
    DocumentBuilder db = processor.newDocumentBuilder();
    evaluator.setContextItem(db.wrap(context));
    evaluator.setExternalVariable(new QName(\"other\"),db.wrap(other));
    Document doc =
      DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
    processor.writeXdmValue(evaluator.evaluate(),new DOMDestination(doc));
    return doc;
  }
    ,        如果我在第二个文件中解决了命名空间问题(通过绑定\“ xsi \”前缀),并使用下面的代码进行合并,则命名空间绑定将保留在输出中;或至少它们在此处(Windows build 1.6.0_24上的香草Java 64位)。
String s1 = \"<!-- 1st XML document here -->\";
String s2 = \"<!-- 2nd XML document here -->\";

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setNamespaceAware( true );
DocumentBuilder builder = factory.newDocumentBuilder();

Document doc1 = builder.parse( new ByteArrayInputStream( s1.getBytes() ) );
Document doc2 = builder.parse( new ByteArrayInputStream( s2.getBytes() ) );

Element doc1root = ( Element )doc1.getDocumentElement();
Element doc2root = ( Element )doc2.getDocumentElement();

NamedNodeMap atts1 = doc1root.getAttributes();
NamedNodeMap atts2 = doc2root.getAttributes();

for( int i = 0; i < atts1.getLength(); i++ )
{
    String name = atts1.item( i ).getNodeName();
    if( name.startsWith( \"xmlns:\" ) )
    {
        if( atts2.getNamedItem( name ) == null )
        {
            doc2root.setAttribute( name,atts1.item( i ).getNodeValue() );
        }    
    }    
}

NodeList nl = doc1.getDocumentElement().getChildNodes();
for( int i = 0; i < nl.getLength(); i++ )
{
    Node n = nl.item( i );
    doc2root.appendChild( doc2.importNode( n,true ) );

}

TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
StreamResult streamResult = new StreamResult( System.out );
transformer.transform( new DOMSource( doc2 ),streamResult );
    ,        这里的问题是在属性值中使用名称空间前缀。创建命名空间标准时从未考虑过的东西,以及常见的Java DOM / XML工具无法轻松处理的东西。但是,您可以通过以下方法解决它 合并之前,将ѭ9的每个实例替换为ѭ10。这样,您就不必依赖前缀映射。在您的示例中,
<xsi:type=\"ns2:SomeType\"
将变为
xsi:type=\"{http://myotherurl.com/}SomeType\"
。 合并文档。 在结果文档上,在步骤1中撤消替换。必须仔细管理前缀映射,以免发生冲突。可能必须创建一个新的映射。     ,        我将使用JAXB和Mergeable插件在派生于架构的类中生成
mergeFrom
方法。然后: o1,o2的元帅 使用生成的方法将o1,o2转换为o3 O3元帅 JAXB通常相当好地处理
xsi:type
。     ,        更新   这不适用于以下情况   这两个文件有冲突   命名空间前缀(来自   第二份文件将取代   从第一个开始映射。 您可以将名称空间声明从第二个文档复制到导入的节点。由于子节点可以覆盖父节点前缀,因此这是有效的:
<foo:root xmlns:foo=\"urn:ROOT\">
    <foo:child xmlns:foo=\"urn:CHILD\" xsi:type=\"foo:child-type\">
       ...
    </foo:child>
</foo:root>
在上述XML中,绑定到前缀\“ foo \”的名称空间在子元素的范围内被覆盖。您可以通过执行以下操作来完成您的用例:
import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Attr;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class Demo {

    public static void main(String[] args) throws Exception  {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        dbf.setNamespaceAware(true);
        DocumentBuilder db = dbf.newDocumentBuilder();

        File file1 = new File(\"src/forum231/input1.xml\");
        Document doc1 = db.parse(file1);
        Element rootElement1 = doc1.getDocumentElement();

        File file2 = new File(\"src/forum231/input2.xml\");
        Document doc2 = db.parse(file2);
        Element rootElement2 = doc2.getDocumentElement();

        // Copy Child Nodes
        NodeList childNodes2 = rootElement2.getChildNodes();
        for(int x=0; x<childNodes2.getLength(); x++) {
            Node importedNode = doc1.importNode(childNodes2.item(x),true);
            if(importedNode.getNodeType() == Node.ELEMENT_NODE) {
                Element importedElement = (Element) importedNode;
                // Copy Attributes
                NamedNodeMap namedNodeMap2 = rootElement2.getAttributes();
                for(int y=0; y<namedNodeMap2.getLength(); y++) {
                    Attr importedAttr = (Attr) doc1.importNode(namedNodeMap2.item(y),true);
                    importedElement.setAttributeNodeNS(importedAttr);
                }
            }
            rootElement1.appendChild(importedNode);
        }

        // Output Document
        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer t = tf.newTransformer();
        DOMSource source = new DOMSource(doc1);
        StreamResult result = new StreamResult(System.out);
        t.transform(source,result);
    }

}
输出量
<?xml version=\"1.0\" encoding=\"UTF-8\" standalone=\"no\"?><tt:root xmlns:tt=\"http://myurl.com/\">
  <tt:child/>
  <tt:child/>

  <ns1:child xmlns:ns1=\"http://myurl.com/\" xmlns:ns2=\"http://myotherurl.com/\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\"/>
  <ns1:child xmlns:ns1=\"http://myurl.com/\" xmlns:ns2=\"http://myotherurl.com/\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\" xsi:type=\"ns2:SomeType\"/>
</tt:root>
原始答案 除了复制元素之外,您还可以复制属性。这将确保生成的文档包含必要的名称空间声明:
import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Attr;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class Demo {

    public static void main(String[] args) throws Exception  {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        dbf.setNamespaceAware(true);
        DocumentBuilder db = dbf.newDocumentBuilder();

        File file1 = new File(\"input1.xml\");
        Document doc1 = db.parse(file1);
        Element rootElement1 = doc1.getDocumentElement();

        File file2 = new File(\"input2.xml\");
        Document doc2 = db.parse(file2);
        Element rootElement2 = doc2.getDocumentElement();

        // Copy Attributes
        NamedNodeMap namedNodeMap2 = rootElement2.getAttributes();
        for(int x=0; x<namedNodeMap2.getLength(); x++) {
            Attr importedNode = (Attr) doc1.importNode(namedNodeMap2.item(x),true);
            rootElement1.setAttributeNodeNS(importedNode);
        }

        // Copy Child Nodes
        NodeList childNodes2 = rootElement2.getChildNodes();
        for(int x=0; x<childNodes2.getLength(); x++) {
            Node importedNode = doc1.importNode(childNodes2.item(x),true);
            rootElement1.appendChild(importedNode);
        }

        // Output Document
        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer t = tf.newTransformer();
        DOMSource source = new DOMSource(doc1);
        StreamResult result = new StreamResult(System.out);
        t.transform(source,result);
    }

}
输出:
<?xml version=\"1.0\" encoding=\"UTF-8\" standalone=\"no\"?>
<tt:root xmlns:tt=\"http://myurl.com/\" xmlns:ns1=\"http://myurl.com/\" xmlns:ns2=\"http://myotherurl.com/\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\">
  <tt:child/>
  <tt:child/>

  <ns1:child/>
  <ns1:child xsi:type=\"ns2:SomeType\"/>
</tt:root>
    ,        如果知道要添加的名称空间URI和前缀URI,就像将属性添加到元素一样容易。当我的合并文档丢失了导入文档中包含的xmlns:xsd = \“ http://www.w3.org/2001/XMLSchema \”时,这对我有用:
    myDocument.getDocumentElement.setAttribute(\"xmlns:xsd\",\"http://www.w3.org/2001/XMLSchema\");
    

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...