问题描述
我有许多使用相同主要文档类型定义(mrinitialman.dtd)的XML文档。某些元素会根据它们所在的页面进行细微调整:例如,SetPage元素,其定义如下:
<!ELEMENT SetPage ((SetImgInf|SetRecInf)?,SetPageName,SetPageDesc?,%credits;)>
<!ELEMENT SetPageName (#PCDATA)>
<!ELEMENT SetPageDesc (#PCDATA)>
SetImgInf和SetRecInf在此文档类型定义中未定义;它们是在需要这些元素的文件的doctype子集中定义的。
例如,recordings.xml在文档类型声明中具有以下内容:
<!DOCTYPE MainPage SYstem "../Site_Data/XML_Etc/mrinitialman.dtd"[
<!ELEMENT SetRecInf EMPTY>
<!ATTLIST SetRecInf recfile CDATA #required>
]>
我在那里定义SetRecInf,因为它是使用该元素的 only 文件。
但是,有两个文件使用SetImgInf:art_gallery.xml和photo_gallery.xml;他们的文档类型是这样的:
<!DOCTYPE MainPage SYstem "../Site_Data/XML_Etc/mrinitialman.dtd" [
<!ELEMENT SetImgInf EMPTY>
<!ATTLIST SetImgInf
imgkeywords CDATA #IMPLIED
imgfile NMTOKEN #required
imgformat (jpg|gif|png|tff|bmp) #IMPLIED
thumbformat (jpg|gif|png|tff|bmp) #IMPLIED
>
]>
是否可以将该位放入其自己的DTD中,从而使art_gallery.xml和photo_gallery.xml都有效地引用两个单独的外部文档类型定义?
解决方法
在XML(和SGML)中,您可以将任何标记声明放入外部实体,然后引用该外部实体。在您的示例中,您将
<!ELEMENT SetImgInf EMPTY>
<!ATTLIST SetImgInf
imgkeywords CDATA #IMPLIED
imgfile NMTOKEN #REQUIRED
imgformat (jpg|gif|png|tff|bmp) #IMPLIED
thumbformat (jpg|gif|png|tff|bmp) #IMPLIED
>
插入setimginf.dtd
(例如),然后更改参数实体声明和后续引用使用该片段的位置:
<!ENTITY % setimginf SYSTEM "setimginf.dtd">
%setimginf;
从技术上讲,使用示例中的外部子集
<!DOCTYPE MainPage SYSTEM
"../Site_Data/XML_Etc/mrinitialman.dtd" [
<!ELEMENT SetImgInf EMPTY>
]>
等同于
<!DOCTYPE MainPage [
<!ELEMENT SetImgInf EMPTY>
<!ENTITY % mrinitialman SYSTEM
"../Site_Data/XML_Etc/mrinitialman.dtd">
%mrinitialman;
]>