试图读取MS Excel文件,版本2016.文件包含几个包含数据的列表.从DataBase下载的文件,可以在MS Office中正确打开.在下面的示例中,我更改了文件名.
编辑:文件包含俄语和英语单词.最有可能使用Latin-1编码,但编码=’latin-1’没有帮助
import pandas as pd
with open('1.xlsx', 'r', encoding='utf8') as f:
data = pd.read_excel(f)
结果:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa8 in position 14: invalid start byte
没有encoding =’utf8′
'charmap' codec can't decode byte 0x9d in position 622: character maps to <undefined>
附:任务是处理52个文件,将每张表中的数据与52个文件中的相应表格合并.所以,请不要处理工作建议.
解决方法:
最有可能的问题是俄罗斯符号.
正如我所看到的,如果utf-8和latin-1没有帮助,那么尝试不读取此文件
pd.read_excel(f)
但
pd.read_table(f)
甚至只是
f.readline()