Linux setxattr:可以使用Unicode字符串吗?

问题描述

我在VS Code中编写了以下代码,并将其运行以设置文件属性。它似乎已成功运行,但是当我检查该值时,文本不正确。文件扩展属性是否支持Unicode字符串?如果是这样,我该如何修复下面的代码

#include <stdio.h>
#include <sys/xattr.h>

int main()
{
    printf("ねこ\n");
    ssize_t res = setxattr("/mnt/cat/test.txt","user.dog","ねこ",2,0); /*also tested 4 and 8*/
    printf("Result = %lu\n",(unsigned long)res);
    return 0;    
}

程序输出

ねこ
Result = 0

阅读属性

$ getfattr test.txt  -d
# file: test.txt
user.dog=0s44E=

解决方法

显然ねこ不能以2个字节存储。字符为U + 306D和U + 3053,以UTF-8编码为E3 81 AD E3 81 93,因此长度必须设置为6。如果这样做,则会看到getfattr test.txt -d输出

user.dog=0s44Gt44GT

这是因为-d的格式不是数据,而是将其转储为二进制。 0s前缀表示该数据位于manpage中所说的base64中:

  • -d--dump

    • 转储所有匹配的扩展属性的值。
  • -e en--encoding=en

    • 在检索值后对其进行编码。 en的有效值为“文本”,“十六进制”和“ base64”。编码为文本字符串的值用双引号(“)引起来,而编码为十六进制和base64的字符串分别以0x和0s作为前缀。

只需将44Gt44GT插入任何base64解码器或运行echo 44Gt44GT | base64 --decode,您就会看到打印出正确的字符串。要直接从getfattr查看字符串,您需要使用-e text

指定格式
$ getfattr -n user.dog -e text test.txt
# file: test.txt
user.dog="ねこ"

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...