XSLT的严格编译,但未在应用程序上验证输入XML

问题描述

我有一个架构(按照前面的问题,但是这次它在FILLEDSQUARETYPE上具有一些“必需”属性)。

<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified"
    xmlns:vc="http://www.w3.org/2007/XMLSchema-versioning" vc:minVersion="1.1">

  <xs:complexType name="SQUARETYPE">
    <xs:sequence>
      <xs:element name="contains">
        <xs:complexType>
          <xs:choice minOccurs="0" maxOccurs="unbounded">
            <xs:element ref="SQUARE"/>
            <xs:element ref="TRIANGLE"/>
          </xs:choice>
        </xs:complexType>
      </xs:element>
    </xs:sequence>
    <xs:attribute name="kind"/>
    <xs:attribute name="width" type="xs:int"/>
    <xs:attribute name="x" type="xs:int"/>
    <xs:attribute name="y" type="xs:int"/>
  </xs:complexType>
  <xs:complexType name="FILLEDSQUARETYPE">
    <xs:sequence>
      <xs:element name="contains">
        <xs:complexType>
          <xs:choice minOccurs="0" maxOccurs="unbounded">
            <xs:element ref="SQUARE"/>
            <xs:element ref="TRIANGLE"/>
          </xs:choice>
        </xs:complexType>
      </xs:element>
    </xs:sequence>
    <xs:attribute name="kind"/>

    <xs:attribute name="colour" type="xs:string" use="required"/>
    <xs:attribute name="width" type="xs:int"  use="required"/>
    <xs:attribute name="x" type="xs:int"  use="required"/>
    <xs:attribute name="y" type="xs:int"  use="required"/>
  </xs:complexType>
  <xs:complexType name="TRIANGLETYPE">
    <xs:sequence>
      <xs:element name="contains">
        <xs:complexType>
          <xs:choice minOccurs="0" maxOccurs="unbounded">
            <xs:element ref="SQUARE"/>
            <xs:element ref="TRIANGLE"/>
          </xs:choice>
        </xs:complexType>
      </xs:element>
    </xs:sequence>
    <xs:attribute name="rotation" type="xs:int"/>
    <xs:attribute name="x" type="xs:int"/>
    <xs:attribute name="y" type="xs:int"/>
  </xs:complexType>
  <xs:element name="SQUARE">
    <xs:alternative test="@kind = 'FILLEDSQUARETYPE'" type="FILLEDSQUARETYPE"/>
    <xs:alternative test="@kind = 'SQUARETYPE'" type="SQUARETYPE"/>
    <xs:alternative type="xs:error"/>
  </xs:element>
  <xs:element name="TRIANGLE">
    <xs:alternative type="TRIANGLETYPE"/>
  </xs:element>
  <xs:element name="rootShape">
    <xs:complexType>
      <xs:choice minOccurs="0" maxOccurs="unbounded">
        <xs:element ref="SQUARE"/>
        <xs:element ref="TRIANGLE"/>
      </xs:choice>
    </xs:complexType>
  </xs:element>
</xs:schema>

我有一个可以针对此XSD进行编译的XSLT,警告为0。 注意它使用“ element(tag,type)”

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:xs="http://www.w3.org/2001/XMLSchema"
    xmlns:msxsl="urn:schemas-microsoft-com:xslt"
    exclude-result-prefixes="xs msxsl"
    version="2.0">

  <xsl:output method="xml" indent="yes" encoding="UTF-8" version="1.0"/>

  <xsl:import-schema schema-location="MessingAbout.xsd"/>
  <xsl:template match="/">
    <xsl:apply-templates select="SQUARE"/>
  </xsl:template>
  <xsl:template match="element(SQUARE,FILLEDSQUARETYPE)">
    <foo>
      <xsl:value-of select="@colour"/>
    </foo>
  </xsl:template>
</xsl:stylesheet>

我可以像这样将转换应用于xmls。

<?xml version="1.0" encoding="utf-8" ?>
<SQUARE x="1" y="2" width="234" kind="FILLEDSQUARETYPE" colour="red">
  <contains/>
</SQUARE>

并获得

<?xml version="1.0" encoding="UTF-8"?>
<foo>red</foo>

万岁!

但是...这是我的“现实世界”场景的简化。 在我的真实场景中,源系统经过了优化,仅导出转换所需的XML(并且该模式描述了一个乌托邦式的世界,在该乌托邦式的世界中,所有数据(包括强制数据,即使不是必需的)也被导出了

例如,变换需要属性“ width”,“ x”,“ y”,因此将被排除……。

<?xml version="1.0" encoding="utf-8" ?>
<SQUARE kind="FILLEDSQUARETYPE" colour="red">
  <contains/>
</SQUARE>

如果我们现在将转换(使用SchemaValidationMode.Strict)应用于此XML,则撒克逊人会抱怨。

它将自动验证输入。

Validation error on line 2 column 46
  FORG0001: required attribute @Q{}y is missing on element <SQUARE>
  Validating /SQUARE[1]
  See http://www.w3.org/TR/xmlschema11-1/#cvc-complex-type clause 4
Validation error on line 2 column 46
  FORG0001: required attribute @Q{}x is missing on element <SQUARE>
  Validating /SQUARE[1]
  See http://www.w3.org/TR/xmlschema11-1/#cvc-complex-type clause 4
Validation error on line 2 column 46
  FORG0001: required attribute @Q{}width is missing on element <SQUARE>
  Validating /SQUARE[1]
  See http://www.w3.org/TR/xmlschema11-1/#cvc-complex-type clause 4
Validation error on line 4 column 10
  XTTE1510: Three validation errors were reported. First error: required attribute @Q{}y is
  missing on element <SQUARE>

即使这些错误与我的XSLT无关,但在我的情况下这还是有问题的,理想情况下,我想关闭此行为,以使saxon不会尝试验证与执行XSLT无关的事情XSLT。

有什么想法吗?

(我显然可以为IS导出的数据子集创建一个模式,但这实际上是相当繁重的,并且具有令人讨厌的含义,即当不同的子集的子集需要有效地存在多种类型来有效地描述相同的乌托邦数据时出口。 我也可以将所有内容都变为可选,但这会大大减少类型检查的值。

解决方法

告诉XSLT编译器有关模式的整个想法是,让它知道看到数据时期望什么;编译器可以生成代码,这些代码假设数据是什么样的。如果数据与架构不符,那将否定整个想法。

很难确切说明如果接受无效数据会导致什么问题,但是XSLT优化器大量使用了架构知识。举一个简单的例子,如果您的样式表确实为<xsl:if test="exists(*)">,并且架构指出该元素将始终具有子元素,那么XSLT处理器很可能已将其优化为“如果为真”。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...