unix – iconv unicode未知输入格式

Bash 2020-09-24

我有一个在Unix下描述的文件：

$file xxx.csv 
xxx.csv: UTF-8 Unicode text,with very long lines

用less / vi查看它会使一些特殊的字符(ßÄ°…)不可读(├╝); Windows也不会显示它;将其直接导入数据库只会将特殊字符更改为其他一些特殊字符(ä,ñ,…).

我想现在将它转换为带有iconv的“默认可读”编码.
当我尝试用iconv转换它时

$iconv -f UTF-8 -t ISO-8859-1 xxx.csv > yyy.csv
iconv: illegal input sequence at position 1234

使用UNICODE作为输入,UTF-8作为输出将返回相同的消息

我猜这个文件有些编码用另一种我不知道的格式 – 我怎么能找出哪种格式才能将它转换成“普遍”可读的东西……

只有当您的UTF-8文本只有可以用ISO-8859-1表示的字符时,才能从UTF-8转换为ISO-8859-1.如果不是这种情况,您应该指定这些字符需要发生什么,忽略(// IGnorE)或近似(// TRANSLIT)它们.尝试以下两种方法之一：

iconv -f UTF-8 -t ISO-8859-1//IGnorE --output=outfile.csv inputfile.csv
iconv -f UTF-8 -t ISO-8859-1//TRANSLIT --output=outfile.csv inputfile.csv

在大多数情况下,我猜近似是最佳解决方案,例如重音字符给他们的非重音对手,欧元签到欧元等等……

相关文章

openwrt临时封禁ip

用的openwrt路由器，家里宽带申请了动态公网ip，为了方便把2...

使用bash脚本并行运行多个程序

#!/bin/bashcommand1&command2&wait从Shell脚本并行...

三步将Mac系统默认PHP版本切换为MAMP等扩展环境中的PHP版本

1.先查出MAMP下面集成的PHP版本cd/Applications/MAMP/bin/ph...

ubuntu16.04中文乱码问题解决

1、先输入locale-a，查看一下现在已安装的语言2、若不存在如...

Bash Perl Tcl syntax diff

BashPerlTclsyntaxdiff1.进制数表示Languagebinaryoctalhexa...

k8s命令补全方法

正常安装了k8s后，使用kubect工具后接的命令不能直接tab补全...