xml学习笔记 2. dtd

DTD Document Type Definition 文档类型定义:为数据编写相应的模式,从而确保数据的有效性。

DTD 是一个面向SGML语言的规范,DTD不仅能规范XML,还能规范SGML以及HTML。

DTD描绘了一个标记语言的词汇表和语法,定义了文档的整体结构以及语法结构。DTD是一种保证XML文档格式是否正确的有效方法。语法形式简单,容易学习。

缺陷:不是专门面向XML的数据模式语言,没有采用XML的语法形式,并不能满足XML的自动化处理的要求(不支持命名空间,缺乏对文档结构、属性、数据类型等约束的足够描述能力等)。


DTD规则可以直接出现在XML文档中,也可以作为一个单独的DTD文件关联与目标XML文档。

在XML文档中,直接在根节点之前声明dtd规则:

<!DOCTYPE root_element [
  ......
    ]> 
引用私有的外部dtd:
<!DOCTYPE root_element SYSTEM "DTD_location">
根节点名称 System表示私有 DTD_location 为相对或绝对的url。
引用共有的外部dtd:
<!DOCTYPE root_element PUBLIC "DTD_name" "DTD_location"> 
根节点 public表示共有 先根据dtd的name去寻找,找不到再用location去查找。



元素:ELEMENT

<!ELEMENT element-name  ...>
后面可以跟元素,属性和文本。

使用EMPTY表示空,ANY表示任意内容

只包含文本内容:

<!ELEMENT element-name (#PCDATA)> 
PCDATA 为Parsed Character Data ,XML解析器进行解析的字符数据,不包含任何XML标记。

包含子元素:

<!ELEMENT element-name (child1,child2,...)> 
(,)表示序列,顺序是固定的。对元素的规定可以加一些正则表达式中的符号 | * ? + 等。

包含子元素与文本内容:

<!ELEMENT element-name (#PCDATA | child1 | child2 | ...)*>
PCDATA必须放在最前面。

对元素添加属性:

<!ATTLIST element-name attr-name attr-type attdesc> 
ATTLIST中的常见属性类型:

CDATA 字符数据“Character data”,不包括转义内容的纯文本内容。文本中的标签不会被当作标记,实体也将不会得到扩展。
(value1|value2|..) 枚举值

ID 表示属性的值在文档中是唯一的,即KEY

IDREF 属性的值引用另一个属性的ID,即FRIEND-KEY

ENTITY 表示属性是一个实体

ENTITIES 用空格隔开的多个实体。

NMTOKEN 表示属性的值必须是有效的 XML 名称标记(Name Token)。

value 缺省值

#REQUIRED 必须的

#IMPLIED 可选的

#FIXED value 属性值为固定的value

举例:

<!ATTLIST memo    id	     ID     	   #REQUIRED
                securit  (high|low) 	   "high"
                keywords    NMTOKENS	   #IMPLIED > 

实体:ENTITY 是内容的占位符,只需要一次声明就可以多次使用。

内部参数实体:

<!ENTITY % entity-name “entity_value”>
实体名与%之间有空格,但使用时没有,引用时%entity-name; 以;结束。

外部参数实体与引用dtd相似,有引用私有的实体和公有的实体两种:

<!ENTITY % entity-name SYSTEM "URI"> 
<!ENTITY % entity-name PUBLIC "public_ID" "URI"> 
一般实体,如之前的预定义的实体一样在xml中使用,
<?xml version="1.0" standalone="yes" ?>
<!DOCTYPE author [
  <!ELEMENT author (#PCDATA)>
  <!ENTITY us "You and me">
]>
<author>&us;</author> 



dtd实例:

为1.xml中两个xml文档所对应的dtd

<?xml version="1.0" encoding="UTF-8"?>
<!-- 被2012 () 使用XMLSpy v编辑的 (http://www.altova.com) by -->
<!ELEMENT info (aliasTable,missionTable,spyTable)>
<!ENTITY % p "(#PCDATA)">
<!ENTITY % q "CDATA">
<!ELEMENT aliasTable (arow*)>
<!ELEMENT arow (spyREF,alias)>
<!ATTLIST arow
	aID %q; #REQUIRED
>
<!ELEMENT spyREF %p;>
<!ELEMENT alias %p;>
<!ELEMENT missionTable (mrow*)>
<!ELEMENT mrow (spyREF,date,description,status)>
<!ATTLIST mrow
	mID ID #REQUIRED
>
<!ELEMENT date %p;>
<!ELEMENT description %p;>
<!ELEMENT status %p;>
<!ELEMENT spyTable (srow*)>
<!ATTLIST srow
	spyID ID #REQUIRED
>
<!ELEMENT srow (firstName,lastName)>
<!ELEMENT firstName %p;>
<!ELEMENT lastName %p;>


<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT info (row*)>
<!ENTITY % p "(#PCDATA)">
<!ATTLIST row
	spyID ID #REQUIRED
>
<!ELEMENT row (firstName,lastName,alias*,mission*)>
<!ELEMENT firstName %p;>
<!ELEMENT lastName %p;>
<!ELEMENT alias %p;>
<!ELEMENT mission (date,status)>
<!ELEMENT date %p;>
<!ELEMENT description %p;>
<!ELEMENT status %p;>

相关文章

php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念