Xml文档编码及encoding属性

#From:http://www.cnblogs.com/azol/articles/1137035.html

#W3C定义了三条XML解析器如何正确读取XML文件的编码的规则:

1,如果文挡有BOM(字节顺序标记,一般来说,如果保存为unicode格式,则包含BOM,ANSI则无) ,就定义了文件编码;
2,如果没有BOM,就查看XML声明的编码属性
3,如果上述两个都没有,就假定XML文挡采用UTF-8编码;

#有了这三条规则,那这个规则就清楚多了。

首先,XML解析器根据文件的BOM来解析文件

如果没找到BOM,由用XML里的encoding属性指定的编码;

如果xml里encoding没指定的话,就认用utf-8来解析文档。

然后又可以推出,BOM和ENCODING都有的话,则以BOM指定的为准。


!啊,突然觉得有标准文档多好!虽然是那么的理所当然,至此,终于把xml里的encoding和文件格式的关系弄懂了。

相关文章

php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念