问题描述
我正在用 java 上的 saxParser 解析一个 xml 文件。 我的问题是我有一些这样的行:
<name xml:lang="en">Particulates,< 2.5 um</name>
我不会报告所有代码,但如果标签 == 名称,我会在对象上设置名称。
@Override
public void characters(char[] ch,int start,int length) throws SAXException {
if (isElementaryExchange && isName ) {
String name = new String(ch,start,length);
this.currentElementaryFlowBase.setName(name);
}
问题是结果是 name=" 2.5 um" 因为我认为 "
编辑 用 Stringbuilder 解决: 追加字符方法,只在元素末尾设置结果!
解决方法
“小于”字符 <
未转义,因此 XML 无效。
见Section 2.4 at the W3C XML definition:
与符号 (&) 和左尖括号 (它们必须分别使用数字字符引用或字符串“&”和“。
或者,在正则表达式中:
CharData ::= [^<&]* - ([^<&]* ']]>' [^<&]*)
因此您必须转义 <
才能获得有效的 XML(例如使用 <
)。否则您的输入文件不是有效的 XML,您必须向其创建者投诉任何后续问题。