带有 < 字符的 SaxParser 问题

问题描述

我正在用 java 上的 saxParser 解析一个 xml 文件。 我的问题是我有一些这样的行:

<name xml:lang="en">Particulates,< 2.5 um</name>

我不会报告所有代码,但如果标签 == 名称,我会在对象上设置名称

    @Override
public void characters(char[] ch,int start,int length) throws SAXException {
    if (isElementaryExchange && isName ) {
        String name = new String(ch,start,length);
        this.currentElementaryFlowBase.setName(name);
    }

问题是结果是 name=" 2.5 um" 因为我认为 "


编辑 用 Stringbuilder 解决: 追加字符方法,只在元素末尾设置结果!

解决方法

“小于”字符 < 未转义,因此 XML 无效。
Section 2.4 at the W3C XML definition

与符号 (&) 和左尖括号 (它们必须分别使用数字字符引用或字符串“&”和“。

或者,在正则表达式中:

CharData ::= [^<&]* - ([^<&]* ']]>' [^<&]*)

因此您必须转义 < 才能获得有效的 XML(例如使用 &lt;)。否则您的输入文件不是有效的 XML,您必须向其创建者投诉任何后续问题。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...