Xml解析好奇心-属性中的“大于”

问题描述

|| 我有一些看起来像这样的xml:
<rootElement attribute=\' > \'/>
我尝试过的解析器将其视为格式正确的xml,并且RFC的相关部分也表明这是有效的,尽管我个人并不确信直到我检查了它(有趣的是, \如果它是一个开放的三角括号,则无效,但它是一个封闭的括号)。 我有一些用于“漂亮打印” xml的代码-它只应更改行长和换行-不应更改任何内容。但是,无论我如何尝试解析此xml,它总是最终被实体替换:
<rootElement attribute=\' &gt; \'/>
这并不是完全出乎意料的,任何xml解析器都应将两者视为相同,但出于我的目的,我不希望出现这种情况,因为这是仅用于更改xml文件格式而不是更改其内容格式的代码。 是否将xml加载到XmlDocument中都没有关系:
var xml = \"<rootElement attribute=\' > \'/>\";
var doc = new XmlDocument();
doc.LoadXml(xml);
Console.WriteLine(doc.OuterXml);
或XElement:
var xElement = XElement.Parse(xml);
xElement.Save(Console.Out);
或通过读写器对传递它:
using (var ms = new MemoryStream())
using (var streamWriter = new StreamWriter(ms))
{
    streamWriter.Write(xml);
    streamWriter.Flush();
    ms.Position = 0;

    using (var xmlReader = XmlReader.Create(ms))
    {
        xmlReader.Read();
        Console.WriteLine(xmlReader.ReadOuterXml());
    }
}
它们都用ѭ6acceptable替换了ѭ5all实体,尽管前者是可以接受的格式良好的xml。我尝试过使用各种
XmlReaderSettings
或XElement的
LoadOptions
等,但都无济于事。 有人知道有什么方法可以防止这种情况吗? 与其说是实际的问题,不如说是好奇心,但是我很想知道是否有人有任何解决方案。 [根据一些评论/答案进行编辑以澄清] 我确实意识到这种行为是预期的。就我而言,也许我根本就不想使用内置的xml API之一(尽管我所使用的任何内容都需要了解xml的结构,以免在不适当的地方换行,因为它会改变xml的语义)该文档。) 我真的只是想知道是否有人知道改变这些解析器中的行为的方式(我希望您不能,但是如果有人知道,他们可能会使用SO),或者有人任何其他想法。     

解决方法

我的猜测是,您会发现没有办法改变它-因为我强烈怀疑加载后的内部表示形式是否相同,无论它最初是5英镑还是6英镑。     ,有趣的是,
xr.GetAttribute(\"attribute\")
会返回您期望的
\" > \"
。我的猜测是,在
ReadOuterXml
中创建XML时,它将所有
>
编码为
&gt;
。因此,要解决该问题,您需要对每个节点进行处理以使其漂亮地打印出来。