snscrape在python中解码推文

问题描述

我正在尝试使用 snscrape 检索一些推文,但生成的 JSON 文件编码为“cp1252”。 我无法在文档中找到是否有办法请求按照我的意愿对 JSON 文件进行编码,但是,这不可能,我如何将相当大的文本文件从 cp1252 转换为 UTF-8? 我见过很多此类问题,但它们都解释了如何打印正确的文本而不是将其存储在文件中。

这个问题不是 this one 的重复,因为我不是想通过 cmd 而是通过 python 来做。

编辑: 我将尝试更好地解释这种情况:我正在检索推文,但它们恰好包含 unicode 字符。这是一个我想解码的句子的例子:

生命之夜\u00e8 Fantasya 我提取了写这句话的文件的编码,它是'cp-1252'。我不再确定这是否是包含 unicode 字符的“cp-1252”文件(这甚至可能吗?),但我没有成功将“\u00e8”转换为我的“è”。

在第一条评论之后,这是我尝试过的:

file = open(file_name_input,encoding='cp1252')
file_output = open(file_name_output,'w')
for line in file:
    file_output.write(line.encode('utf-8').decode())

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)