使用Python 3.8.x二进制编码而不是UTF-8编码的Whoosh 2.7?

问题描述

我事先向社区表示了另一个编码/解码问题。

我在Python 3.8中使用latest Whoosh version,2.7.4,

当前,我正在尝试为文档数据库建立索引。将第一个文档添加到索引后, 我使用搜索器词典方法进行了一个简单的测试,以检出新的索引项,只是注意到尽管我对索引编写器的所有输入都是unicode,但所有令牌都以字节字符串形式返回。在彻底搜索文档和讨论之后,我仍然没有找到如何为架构字段指定所需的字符串格式。

在思考了这个问题之后,我认为唯一的影响可能是对输出检查的影响,我可以将其解码回utf-8,希望即使对查询使用unicode输入,也不会影响查询/搜索结果。即使我感觉自己缺少某些东西,并且将来可能会不好用Whoosh,但有人能在这个问题上大放光彩吗?

提前谢谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)