处理XML性能的比较DOM和SAX

测试数据是结构很简单的一个20M的XML文档,里面的数据来自我的一个项目。测试程序很简单,就是读取这个XML文件,把里面的链接写入到一个文本文件。然后把数据原样重复了一遍,然后又测试了一次,下面是测试结果。

方法 数据大小 内存峰值
CPU峰值
耗时
SAX 20M 20M 30% 142秒
DOM 20M 152M 100% 171秒
SAX 40M 20M 30% 290秒
DOM 40M 345M 100% 376秒

表1 SAX和DOM的性能比较

结论:SAX的内存消耗稳定,CPU占用率低,耗时短,大数据量XML的简单处理一定首选SAX。DOM的性能受到内存的严重影响,内存消耗受到数据量的影响,大数据量XML的读处理最好不要用DOM。


正则应该跟SAX差不多,这里比较又不是说谁好.
只是对大文件处理的具体性能做一个量化的比较而已。
DOM比较简单,所以一般程序用的比较多,这对大多数的情形是没有问题的。但是遇到了大XML,DOM的内存占用往往会造成问题。比如我的测试数据有20M,放置在了DreamWeaver设置的一个site里面,结果这个文件造成我的DreamWeaver在site caching过程失去响应……测试文件删除后,DreamWeaver启动完全正常。

没有层次的数据,建议就用流的方式进行

相关文章

php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念