问题描述
我需要从 Excel 2016 将文件导出到制表符分隔的 txt 中,编码为 ISO-8859-1,同时保留所有特殊字符。有什么想法吗?
解决方法
(您的问题本质上与编程无关,但由于这里已经存在许多类似但不相同的问题,我正在回答。)
你没有提到你正在使用哪个操作系统,所以我描述了一个平台中立的解决方案。
我使用 pipx
来安装 python 工具,但我认为您可以将 pipx
替换为 pip
(可能是 sudo pip
)。
pipx install xlsx2csv
xlsx2csv --delimiter 'tab' infile.xlsx outfile.tsv
默认编码是 utf-8
,但如果上面没有给你你想要的,我会感到惊讶。我没有您特定版本的 Excel;我在 macOS Big Sur 上使用 Excel v16.08。在我对 Excel 工作表中的挪威语字符进行的测试中,使用 xlsx2csv --outputencoding ISO-8859-1
或 xlsx2csv --outputencoding latin-1
没有产生好的结果,但 utf-8
(默认值)可以。