snscrape在python中解码推文

问题描述

我正在尝试使用 snscrape 检索一些推文，但生成的 JSON 文件编码为“cp1252”。我无法在文档中找到是否有办法请求按照我的意愿对 JSON 文件进行编码，但是，这不可能，我如何将相当大的文本文件从 cp1252 转换为 UTF-8？我见过很多此类问题，但它们都解释了如何打印正确的文本而不是将其存储在文件中。

这个问题不是 this one 的重复，因为我不是想通过 cmd 而是通过 python 来做。

编辑：我将尝试更好地解释这种情况：我正在检索推文，但它们恰好包含 unicode 字符。这是一个我想解码的句子的例子：

生命之夜\u00e8 Fantasya 我提取了写这句话的文件的编码，它是'cp-1252'。我不再确定这是否是包含 unicode 字符的“cp-1252”文件（这甚至可能吗？），但我没有成功将“\u00e8”转换为我的“è”。

在第一条评论之后，这是我尝试过的：

file = open(file_name_input,encoding='cp1252')
file_output = open(file_name_output,'w')
for line in file:
    file_output.write(line.encode('utf-8').decode())

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

cp1252 decode decode python