前言:
XML是(Extensible MarkuP Language)可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。
什么是XML?
XML是可扩展的标记语言,类似于HTML,其设计宗旨是传输数据,而非显示数据。XML标签没有被预定义,需要自行定义标签。XML被设计为具有自我描述性,是W3C的推荐标准。
XML与HTML的主要差异?
1)XML不是HTML的替代。
2)XML和HTML为不同的目的而设计:
XML被设计为传输和存储数据,其焦点是数据的内容;
HTML被设计用来显示数据,其焦点是数据的外观;HTML旨在显示信息,而XML旨在传输信息。
XML文档实例:
<?xml version="1.0" encoding="ISO-8859-1"?> <note> <to>George</to> <from>John</from> <heading>Reminder</heading> <body>Don't forget the meeting!</body> </note>
第一行是XML声明。它定义XML版本(1.0)和所使用的编码(ISO-8859-1=Latin-1/西欧字符集)。
第二行描述文档的跟元素,接下来4行描述跟的4个子元素(to、from、heading以及body)最后一行定义根元素的结尾。
XML文档形成一种树结构:
XML文档必须包含根元素(只能有一个)。该元素是所有其他元素的父元素。XML文档中的元素形成了一颗文档树。这棵树从根部开始,并扩展到树的最低端。
实例:
<bookstore> <book category="COOKING"> <title lang="en">Everyday Italian</title> <author>Giada De Laurentiis</author> <year>2005</year> <price>30.00</price> </book> <book category="CHILDREN"> <title lang="en">Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price> </book> <book category="WEB"> <title lang="en">Learning XML</title> <author>Erik T. Ray</author> <year>2003</year> <price>39.95</price> </book> </bookstore>
根元素是<bookstore>,文档中的所有<book>元素都被包含在<bookstore>中。<book>元素有四个子元素:<title>、<author>、<year>、<price>。
实体引用:
为了避免把字符数据和标签中需要用到的一些特殊符号相混淆,XML还提供了实体引用。
字符 | 实体引用 |
& | &; |
> | >; |
< | <; |
“ | "; |
, | &apos; |
格式良好的XML:
1)格式良好well-formed;
2)拥有正确语法的XML被称为“形式良好”的XML;
3)通过DTD验证的XML是“合法”的XML;
4)格式良好的XML会遵循以下XML语法规则:
a.XML文件必须有根元素;
c.XML标记对大小写敏感;
d.XML元素必须被正确的嵌套;
e.XML属性必须加引号;