python抓取后无法以UTF-8格式读取具有Excel的导入的csv文件

问题描述

我有一个用utf-8编码的csv文件(通过使用python代码进行抓取,从网站上填充了信息,最后以str(data_scrapped.encode('utf-8')开头))。 当我将其导入到excel(即使我在选项中选择65001:Unicode UTF8)时,它也不显示特殊字符。 例如,它将显示\ xc3 \ xa4而不是ä

有什么想法吗?

解决方法

我解决了这个问题。 原因是在原始代码中,我删除了诸如\ t \ n之类的通过替换功能“污染”输出的项目。我想我删除了太多内容,之后对于excel来说是不可读的。

在最终版本中,我没有使用 str(data_scrapped.encode('utf-8')但 data_scrapped.encode('utf-8','ignore')。decode('utf-8')

然后,我使用split和join删除了“污染术语”: string_split = data_scrapped.split()
data_scrapped =“” .join(string_split)