在 XML 中使其无法解析

问题描述

所以我的数据库中有一个值,其中有一个   形式的非中断空间。我有一个遗留服务,它从数据库中读取这个字符串并使用这个字符串创建一个 XML。我面临的问题是为此消息返回的 XML 无法解析。当我在记事本 ++ 中打开它时,我看到字符 xA0 代替了不间断空格,并且在删除此字符时,XML 变得可解析。此外,我有来自同一服务的此 XML 文件的较旧版本,其中字符 "Â " 代替了不间断空格。我最近更改了运行该服务的tomcat服务器,因此出现了问题。我发现这个 post 根据我的 XML 被编码为 ISO-8859-1; 但我用来将 XML 转换为字符串的代码不使用 ISO-8859-1;。下面是我的代码

private String nodetoString(Node node) {
        StringWriter sw = new StringWriter();

        try {
            Transformer t = TransformerFactory.newInstance().newTransformer();
            t.setoutputProperty(OutputKeys.OMIT_XML_DECLaraTION,"no");
            t.transform(new DOMSource(node),new StreamResult(sw));


        } catch (TransformerException te) {
            LOG.error("Exception during String to XML transformation ",te);
        }
        return sw.toString();

    }

我想知道为什么我的 XML 无法解析,为什么在 XML 文件的旧版本中有 "Â "

这是记事本++中有问题的字符的图像 image in notepad++

此外,当我在记事本中打开我的 XML 并尝试保存它时,我看到编码类型是 ANSI,当我将其更改为 UTF-8 然后将其保存时,XML 变得可解析。

新信息 - 使用 transformer.setoutputProperty(OutputKeys.ENCODING,"UTF-8"); 强制执行 UTF-8 不起作用我仍然在我的 XML 中获取 xA0。

解决方法

问题是我的 java 版本以某种方式将我的文件保存为 ANSI 文件格式。当我在记事本中打开我的文件并尝试保存它时,我看到了这一点。较旧的文件采用 UTF-8 格式。所以我所做的只是在写入文件时指定 UTF-8 编码。

Writer out = new BufferedWriter(new OutputStreamWriter(
                new FileOutputStream(fileName.trim()),StandardCharsets.UTF_8));
        try {
            out.write(data);
        } finally {
            out.close();
        }

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...