带有特殊字符的neo4j全文索引搜索

问题描述

我们使用的是neo4j 4.1.1版, 我们有一个表示对象结构的图。
我们支持使用节点进行翻译,对象和翻译节点之间的联系是对象名称和描述。
例如:
(n:object)-[r:Translation]-(:ru)
表示关系 r 是对象 n 的俄语名称和描述。
为了按名称和描述进行搜索,我们实现了这样的全文索引:
CALL db.index.fulltext.createRelationshipIndex("TranslationRelationshipIndex",["Translation"],["Name","Description"],{ eventually_consistent: "true" })

我们还支持搜索项目,我们使用索引进行查询,我们有像“UFO41.SI01V03”这样的名称
CALL db.index.fulltext.queryRelationships('TranslationRelationshipIndex','*FO41.SI0*') YIELD relationship,score 
但是对于如上所示的名称([0-9.*]) 没有返回结果
而结果返回的名称如“ab.or

有没有人知道如何使它工作?我已经尝试了所有可用的 46 款分析仪。 我知道我们只需使用 match()-[r]-() where r.Name contains "<string>" 就可以解决它 但我们更喜欢使用更高效的索引解决方案来解决这个问题。

注意安全! 并提前致谢。

p.s 如果需要,我可以提供几行代码以在本地重新创建它,只是询问。

解决方法

分析器可能会以与 ab.or 不同的方式识别 ab.or123 之类的单词,并在第一种情况下将它们视为单个标记,在第二种情况下将它们视为两个标记。

除了创建自己的分析器之外,没有任何分析器能真正满足您的需求。

然而,您可以将查询中的 . 替换为简单的 AND,例如:

CALL db.index.fulltext.queryNodes('Test',replace("*FO41.SI0*","."," AND "))

将返回您正在查看的结果。


用于创建自己的分析器的资源:

https://graphaware.com/neo4j/2019/09/06/custom-fulltext-analyzer.html

https://neo4j.com/docs/java-reference/current/extending-neo4j/full-text-analyzer-provider/