linux curl另存为utf-8

尝试使用 linux curl从url下载xml文件.

很确定xml是用UTF-8编码的,

怀疑curl -o不会保存为UTF-8.

无论如何强制保存到UTF-8卷曲?

感谢您的建议,我发现了:

因为xml提要是动态的,所以它不是一直包含任何utf-8字符.
有时它在整个内容中根本没有utf-8字符,即使它在xml编码和标题内容类型中设置为utf-8:charset = utf-8.当它至少包含一个utf-8字符时,它将保存为utf-8.

当发生这种情况时,curl不会下载为utf-8,这是有意义的,因为没有utf-8字符,为什么需要存储为utf-8.

这是非常棘手的,一些验证器必须对utf-8有效,因此我仍然需要一个解决方案来强制它到utf8,因为认情况下我的所有xml shld都是utf8编码.

尝试使用iconv f iso8859-1 utf-8的建议不适用于这种情况,因为我怀疑它不在iso8859-1.

还需要更好的解决方案.

解决方法

curl不会对它下载的文件进行任何转换.如果HTTP服务器以另一种编码(例如,ISO8859-1)为您提供 XML,那么他的curl将如何将其保存到磁盘.

解决您的问题,您可以使用“iconv”,如下所示:

curl URL | iconv -f iso8859-1 -t utf-8 > output.xml

希望这有帮助.

相关文章

1、安装Apache。 1)执行如下命令,安装Apache服务及其扩展包...
一、先说一下用ansible批量采集机器信息的实现办法: 1、先把...
安装配置 1. 安装vsftpd 检查是否安装了vsftpd # rpm -qa | ...
如何抑制stable_secret读取关键的“net.ipv6.conf.all.stabl...
1 删除0字节文件 find -type f -size 0 -exec rm -rf {} ...
## 步骤 1:安装必要的软件包 首先,需要确保系统已安装 `dh...