四种读取XML文方法研究

XML 2020-05-31

测试开始先读取XML源，用一个比较大的RSS 文件链接，复制到项目bin/debug目录下。

Stream xmlStream = new MemoryStream（File.ReadAllBytes（path））；一、XmlDocument 方式

代码

static IList testXmlDocument（）

{

var doc = new XmlDocument（）；

doc.Load（xmlStream）；

var nodeList = doc.DocumentElement.ChildNodes;

var lstChannel = new List<Object>（nodeList.Count ）；

foreach （XmlNode node in nodeList）

{

var channel = new { Title = node.SelectSingleNode（"title"）。

InnerText,Link = node.SelectSingleNode（"link"）。

InnerText,Description = node.SelectSingleNode（"description"）。

InnerText,Content = node.SelectSingleNode（"content"）。

InnerText,PubDate = node.SelectSingleNode（"pubDate"）。

InnerText,Author = node.SelectSingleNode（"author"）。

InnerText,Category = node.SelectSingleNode（"category"）。

InnerText };

lstChannel.Add（channel）；

}

return lstChannel;

}
2

二、XPathNavigator 方式

代码

static IList testXmlNavigator（）

{

var doc = new XmlDocument（）；

doc.Load（xmlStream）；

var nav = doc.CreateNavigator（）；

nav.MovetoRoot（）；

var nodeList = nav.Select（"/channel/item"）；

var lstChannel = new List<Object>（nodeList.Count）；

foreach （XPathNavigator node in nodeList）

{

var channel = new {

Title = node.SelectSingleNode（"title"）。

Value,Link = node.SelectSingleNode（"link"）。

Value,Description = node.SelectSingleNode（"description"）。

Value,Content = node.SelectSingleNode（"content"）。

Value,PubDate = node.SelectSingleNode（"pubDate"）。

Value,Author = node.SelectSingleNode（"author"）。

Value,Category = node.SelectSingleNode（"category"）。

Value };

lstChannel.Add（channel）；

}

return lstChannel;

}
3

三、XmlTextReader 方式

代码www.cdtarena.com

static List<Channel> testXmlReader（）

{

var lstChannel = new List<Channel>（）；

var reader = XmlReader.Create（xmlStream）；

while （reader.Read（））

{

if

（reader.Name == "item" && reader.NodeType == XmlNodeType.Element）

{ var channel = new Channel（）；

lstChannel.Add（channel）；

while （reader.Read（））

{

if （reader.Name == "item"） break;

if （reader.NodeType != XmlNodeType.Element） continue;

switch （reader.Name）

{

case "title": channel.Title = reader.ReadString（）；

break;

case "link": channel.Link = reader.ReadString（）；

break;

case "description": channel.Description = reader.ReadString（）；

break;

case "content": channel.Content = reader.ReadString（）；

break;

case "pubDate": channel.PubDate = reader.ReadString（）；

break;

case "author": channel.Author = reader.ReadString（）；

break;

case "category": channel.Category = reader.ReadString（）；

break;

default: break;

}}}}

return lstChannel;

}

4

四、Linq to XML 方式

static IList testXmlLinq（）

{

var xd = XDocument.Load（xmlStream）；

var list = from node in xd.Elements（"channel"）。Descendants（"item"）

select new

{

Title = node.Element（"title"）。

Value,Link = node.Element（"link"）。

Value,Description = node.Element（"description"）。

Value,Content = node.Element（"content"）。

Value,PubDate = node.Element（"pubDate"）。

Value,Author = node.Element（"author"）。

Value,Category = node.Element（"category"）。

Value };

return list.ToList（）；

测试结果：

XmlDocment 47ms

XPathNavigator 42ms

XmlTextReader 23ms

Xml Linq 28ms

5

小结一下自己的认识，XmlDocument的操作基本按W3C的DOM操作方式，不过要将全部节点解析成对象加载到内存中，往往造成很大浪费。所以微软自己的编程规范也不推荐用它。这里由于读取了所有节点，可能因此性能和Navigator方式相差不大。在三种随机读取方式中，Xml Linq性能最高，只是方法名有点别扭。XmlTextReader方式是所谓的SAX,只读向前，无疑性能最高，不过实现上麻烦了不少，要比较精确的控制访问逻辑，也无法用匿名类存储数据。

.Net 3.5发布Xml Linq可以很好地取代前两种方式，通常情况下，最好用它。只有个别场合，如果对性能要求极高，或者读取Xml数据量太大不能一下子下载或读取到内存中，那就只好痛苦委身于XmlTextReader了。

相关文章

php输出xml格式字符串

php输出xml格式字符串

J2ME Mobile 3D入门教程系列文章之一

J2ME Mobile 3D入门教程系列文章之一

XML轻松学习手册

XML轻松学习手册

XML入门的常见问题(一)

XML入门的常见问题(一)

XML入门的常见问题(三)

XML入门的常见问题(三)

XML轻松学习手册（2）XML概念

XML轻松学习手册（2）XML概念