引用外部DTD的内部子集DTD

问题描述

我有许多使用相同主要文档类型定义(mrinitialman.dtd)的XML文档。某些元素会根据它们所在的页面进行细微调整:例如,SetPage元素,其定义如下:

<!ELEMENT SetPage ((SetImgInf|SetRecInf)?,SetPageName,SetPageDesc?,%credits;)>
            
            <!ELEMENT SetPageName (#PCDATA)>
            <!ELEMENT SetPageDesc (#PCDATA)>

SetImgInf和SetRecInf在此文档类型定义中未定义;它们是在需要这些元素的文件的doctype子集中定义的。

例如,recordings.xml在文档类型声明中具有以下内容

<!DOCTYPE MainPage SYstem "../Site_Data/XML_Etc/mrinitialman.dtd"[
    <!ELEMENT SetRecInf EMPTY>
    <!ATTLIST SetRecInf recfile CDATA #required>
]>

我在那里定义SetRecInf,因为它是使用该元素的 only 文件

但是,有两个文件使用SetImgInf:art_gallery.xml和photo_gallery.xml;他们的文档类型是这样的:

<!DOCTYPE MainPage SYstem "../Site_Data/XML_Etc/mrinitialman.dtd" [
    <!ELEMENT SetImgInf EMPTY>
        <!ATTLIST SetImgInf
            imgkeywords CDATA   #IMPLIED
            imgfile     NMTOKEN #required
            imgformat (jpg|gif|png|tff|bmp) #IMPLIED 
            thumbformat (jpg|gif|png|tff|bmp) #IMPLIED
        >

]>

是否可以将该位放入其自己的DTD中,从而使art_gallery.xml和photo_gallery.xml都有效地引用两个单独的外部文档类型定义?

解决方法

在XML(和SGML)中,您可以将任何标记声明放入外部实体,然后引用该外部实体。在您的示例中,您将

<!ELEMENT SetImgInf EMPTY>
<!ATTLIST SetImgInf
        imgkeywords CDATA   #IMPLIED
        imgfile     NMTOKEN #REQUIRED
        imgformat (jpg|gif|png|tff|bmp) #IMPLIED 
        thumbformat (jpg|gif|png|tff|bmp) #IMPLIED
    >

插入setimginf.dtd(例如),然后更改参数实体声明和后续引用使用该片段的位置:

<!ENTITY % setimginf SYSTEM "setimginf.dtd">
%setimginf;

从技术上讲,使用示例中的外部子集

<!DOCTYPE MainPage SYSTEM
  "../Site_Data/XML_Etc/mrinitialman.dtd" [
  <!ELEMENT SetImgInf EMPTY>
]>

等同于

<!DOCTYPE MainPage [
  <!ELEMENT SetImgInf EMPTY>
  <!ENTITY % mrinitialman SYSTEM
    "../Site_Data/XML_Etc/mrinitialman.dtd">
  %mrinitialman;
]>