python抓取后无法以UTF-8格式读取具有Excel的导入的csv文件

问题描述

我有一个用utf-8编码的csv文件（通过使用python代码进行抓取，从网站上填充了信息，最后以str（data_scrapped.encode（'utf-8'）开头））。当我将其导入到excel（即使我在选项中选择65001：Unicode UTF8）时，它也不显示特殊字符。例如，它将显示\ xc3 \ xa4而不是ä

有什么想法吗？

解决方法

我解决了这个问题。原因是在原始代码中，我删除了诸如\ t \ n之类的通过替换功能“污染”输出的项目。我想我删除了太多内容，之后对于excel来说是不可读的。

在最终版本中，我没有使用 str（data_scrapped.encode（'utf-8'）但 data_scrapped.encode（'utf-8'，'ignore'）。decode（'utf-8'）

然后，我使用split和join删除了“污染术语”： string_split = data_scrapped.split（）
data_scrapped =“” .join（string_split）

encoding excel excel python web-scraping