`re.Pattern.search()`

问题描述

我收到了关于我编写的库的错误报告。症状是编译后的 searchPattern 方法引发 UnicodeDecodeError。 Python re 库文档未提及 UnicodeDecodeError

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 32: invalid start byte

search 的参数是 Windows 文件路径。我怀疑有问题的路径是格式错误的 UTF-16,并且与文件系统交互的(第三方、编译的、闭源的)代码正在创建一个格式错误的 Python 字符串对象,然后 search 是结果以不寻常的方式失败。不幸的是,我没有关于损坏的文件路径可能是什么的任何具体信息,因此我无法直接对其进行测试。

我的问题:

  1. 这是可能发生的事情吗?
  2. 在纯 Python 中是否有任何方法可以构造格式错误的 Python 字符串,或检查给定字符串是否格式错误

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)