使用字典和转义符时奇怪的Python行为

问题描述

我是Python的新手，我正在尝试以以前的方式执行简单的任务，但是我遇到了一个有趣的...功能？

下面的代码正是我想要的：

def cleanLDAP(search):
  escChars = {'(':r'\28',')':r'\29' }
  for ch,val in escChars.items():
    if ch in search:
      search = search.replace(ch,val)
  return search

cleanLDAP('(123)')

输出是我期望的'\\28123\\29'，但是当我如下更改escChars时：

escChars = {'(':r'\28',')':r'\29','\\': '\5c' }

输出变得有点奇怪：'\x05c28123\x05c29'

我知道我可能会错过一些隐式的编码更改，但是我仍然想知道为什么会发生这种情况？预先谢谢你！

解决方法

5c中的

utf-8是\。

当您尝试将字符串另存为\5c时，Python返回utf-8的{{1}}十六进制，因为您为字符串加上了5c前缀，这会使您的值变成：{{ 1}}。

当您遍历密钥时，在迭代中要测试的\x05c是'\5c' #'\x05c' '5c' #'5c' escChars #{'(': '\\28',')': '\\29','\\': '\x05c'}，因为您没有使用ch格式字符串\保存密钥

raw

最后，由于您每次在迭代过程中找到匹配项时都在进行修改，因此您要检查r是否存在，在之后通过for ch,value in escChars.items(): print(ch,value) #( \28 #) \29 #\ c添加>

这将导致您先进行替换，然后将插入字符串中的\替换为replace()的{{1}}符号。

这里的简单解决方法是用\保存密钥，以确保代码仅与utf-8而不是\匹配，并用相同的值保存值以确保代码不会转换为十六进制。

更改为-

escChars = {'(':r'\28',')':r'\29','\\': r'\5c' }

您错过了添加r'\5c'的工作，而刚做了'\5c'。使其为十六进制。

通过示例进行理解-

a='\5'
a
ord(a)

分别返回'\x05'和5