xml中的前三个字符是什么

问题描述

为什么我通过使用java将文件内容读取为字节数组来得到以下输出

File f = new File( "exampleData.xml" );
byte[] data = getBytesFromFile("data.xml");
for (byte zeichen : data) {
    char zzeichenCharacter = (char)zeichen;
    System.out.println(zzeichenCharacter + "  : " + String.valueOf(zeichen));
}

输出

￯  : -17
ᄏ  : -69
﾿  : -65
<  : 60
?  : 63

当我将内容从exampleData.xml文件复制到名称为exampleDatacopy.xml的第二个文件并使用上面的相同代码时,我得到了不同的输出

<  : 60
?  : 63
x  : 120
m  : 109
l  : 108

解决方法

前三个字节是Byte order mark的UTF-8编码。

十六进制表示为EF BB BF

您应该以UTF-8格式读取文件,而不是逐字节处理文件。