如何使用 SAX 处理程序分析 JAVA DOM 文档?

问题描述

我将在我的代码中编写一个功能,以节省内存/cpu 的方式处理一些 XML 数据。它将主要分析来自文件、流、字节数组等的数据,因此 SAXParser 似乎符合上述所有要求。

不幸的是,这个新功能还需要分析一些由使用 DOM 解决方案并返回 Document 类的旧代码生成的 XML 数据。

当然,我可以将该 DOM 文档保存到文件/流/字节数组等中,然后使用 SAXParser 对其进行处理,但是这样的解决方案需要额外的内存空间来保存该数据,而这在数据处理中是完全不需要的透视。

因此,我正在寻找某种 DOM 文档爬虫,它读取现有的 DOM 数据但使用 SAX 处理程序来处理它,这将允许我在自定义 SAX 处理程序中仅实现一次基本处理逻辑,并且还使用任何类型的输入数据。

你遇到过这样的事情吗?

解决方法

您使用身份转换将 XML 从 DOM 树提供给 SAX 处理程序:

TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
transformer.transform(new DOMSource(document),new SAXResult(handler));

DOMSource 构造函数接受一个 Node,因此您可以仅将其作为 DOM 文档的一部分,即一个 片段

SAXResult 构造函数采用您通常会在 ContentHandler 调用中提供给 XMLReadersetContentHandler(...)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...