Python:如何将utf-8代码字符串转换回字符串?

问题描述

我想这就是你想要的。它不是UTF-8字节字符串(从技术上讲是这样,但这仅是因为ASCII是UTF-8的子集)。

>>> s='\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5'
>>> print s.decode('unicode-escape')
欢迎提交微博搜索使用反馈,请直接

仅供参考,这是UTF-8:

>>> s.decode('unicode-escape').encode('utf8')

’\ xe6 \ xac \ xa2 \ xe8 \ xbf \ x8e \ xe6 \ x8f \ x90 \ xe4 \ xba \ xa4 \ xe5 \ xbe \ xae \ xae \ xe5 \ x8d \ x9a \ xe6 \ x90 \ x90 \ x9c \ xe7 \ xb4 \ xa2 \ xe4 \ xbd \ xbf \ xe7 \ x94 \ xa8 \ xe5 \ x8f \ x8d \ xe9 \ xa6 \ x88 \ xef \ xbc \ x8c \ xe8 \ xaf \ xb7 \ xe7 \ x9b \ xb4 \ xe6 \ x8e \ xa5’

解决方法

我正在使用Python,不幸的是,我的代码需要将代表字符串的utf-8代码的字符串转换为原始字符串,例如:

我从其他代码获得的UTF-8代码字符串:

\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5

我需要将其转换回原始字符串。怎么做?

相关文章

猜你在找的编程问答相关文章

在Pandas数据框中旋转数据表
如何获得浮点序列中的下一个值?
获取Instagram粉丝
在批处理结束时检测到不可提交的事务。交易回滚
将一个文本文件文件夹与一个单元格中的每个内容合并为一个CSV文件
在使用JSON数据时,如何防止我的应用程序意外崩溃,“关闭”,而代之以处理异常?
JDBC批处理INSERT,返回ID
具有多个表的复杂INNER JOIN查询的回显结果