问题描述
我正在尝试使用 python 对我下载的 Instagram 数据进行排序,数据是一个 json 文件,但是 emoji 和其他非文本字符的编码方式我不明白,例如:
json 文件将包含:
\u00e2\u009c\u008c\u00f0\u009f\u0096\u00a4\u00f0\u009f\u008d\u0095\u00f0\u009f\u008e\u00b6\u00f0\u009f\u00a4\u00af
。
在 Instagram 应用程序上显示的是:
✌????
或者json:\u00e2\u0080\u0099
。 Instagram:'
(撇号)
我尝试使用 u"string"
并发现了类似的问题 here、here 和 here,但没有一个是在 python 中或向我提供任何有用的详细信息。>
解决方法
试试
print(('\u00e2\u009c\u008c\u00f0\u009f\u0096\u00a4\u00f0\u009f\u008d\u0095\u00f0\u009f\u008e\u00b6\u00f0\u009f\u00a4\u00af'.encode('latin-1').decode('utf-8')))
输出:
✌????
,
如果您在 Windows 上,请按 win + 。
你会得到一个带有表情符号的提示
然后做
print("?")
输出:
?