问题描述
||
我有一些看起来像这样的xml:
<rootElement attribute=\' > \'/>
我尝试过的解析器将其视为格式正确的xml,并且RFC的相关部分也表明这是有效的,尽管我个人并不确信直到我检查了它(有趣的是, \如果它是一个开放的三角括号,则无效,但它是一个封闭的括号)。
我有一些用于“漂亮打印” xml的代码-它只应更改行长和换行-不应更改任何内容。但是,无论我如何尝试解析此xml,它总是最终被实体替换:
<rootElement attribute=\' > \'/>
这并不是完全出乎意料的,任何xml解析器都应将两者视为相同,但出于我的目的,我不希望出现这种情况,因为这是仅用于更改xml文件格式而不是更改其内容格式的代码。
是否将xml加载到XmlDocument中都没有关系:
var xml = \"<rootElement attribute=\' > \'/>\";
var doc = new XmlDocument();
doc.LoadXml(xml);
Console.WriteLine(doc.OuterXml);
或XElement:
var xElement = XElement.Parse(xml);
xElement.Save(Console.Out);
或通过读写器对传递它:
using (var ms = new MemoryStream())
using (var streamWriter = new StreamWriter(ms))
{
streamWriter.Write(xml);
streamWriter.Flush();
ms.Position = 0;
using (var xmlReader = XmlReader.Create(ms))
{
xmlReader.Read();
Console.WriteLine(xmlReader.ReadOuterXml());
}
}
它们都用ѭ6acceptable替换了ѭ5all实体,尽管前者是可以接受的格式良好的xml。我尝试过使用各种XmlReaderSettings
或XElement的LoadOptions
等,但都无济于事。
有人知道有什么方法可以防止这种情况吗?
与其说是实际的问题,不如说是好奇心,但是我很想知道是否有人有任何解决方案。
[根据一些评论/答案进行编辑以澄清]
我确实意识到这种行为是预期的。就我而言,也许我根本就不想使用内置的xml API之一(尽管我所使用的任何内容都需要了解xml的结构,以免在不适当的地方换行,因为它会改变xml的语义)该文档。)
我真的只是想知道是否有人知道改变这些解析器中的行为的方式(我希望您不能,但是如果有人知道,他们可能会使用SO),或者有人任何其他想法。
解决方法
我的猜测是,您会发现没有办法改变它-因为我强烈怀疑加载后的内部表示形式是否相同,无论它最初是5英镑还是6英镑。
,有趣的是,
xr.GetAttribute(\"attribute\")
会返回您期望的\" > \"
。我的猜测是,在ReadOuterXml
中创建XML时,它将所有>
编码为>
。因此,要解决该问题,您需要对每个节点进行处理以使其漂亮地打印出来。