在Hibernate Search中为匹配项使用自定义分析器

问题描述

我有一个带有自定义分析器的字段。

@Analyzer(deFinition = "edgeNgram")
@Field(index = Index.YES,analyze = Analyze.YES,store = Store.YES)
@Lob
String value;

这是我班上的分析仪。

@AnalyzerDef(name = "edgeNgram",tokenizer = @TokenizerDef(factory = WhitespacetokenizerFactory.class),filters = {
                @TokenFilterDef(factory = ASCIIFoldingFilterFactory.class),// Replace accented characters by their simpler counterpart (è => e,etc.)
                @TokenFilterDef(factory = LowerCaseFilterFactory.class),// Lowercase all characters
                @TokenFilterDef(
                        factory = EdgeNGramFilterFactory.class,// Generate prefix tokens
                        params = {
                                @org.hibernate.search.annotations.Parameter(name = "minGramSize",value = "4"),@org.hibernate.search.annotations.Parameter(name = "maxGramSize",value = "10")
                        }
                )
        })

然后在这里创建我的查询

query = queryBuilder
        .simpleQueryString()
        .boostedTo(3f) // This whole query is boosted so exact matches will obtain a better score
        .onFields("title.value","keyword.values.value")
        .boostedTo(2f)
        .andField("description.values.value")
        //.withAndAsDefaultOperator()
        .matching(Arrays.stream(searchTerm.split(" ")).map(e -> e + "*").collect(Collectors.joining(" ")).toLowerCase())
        .createquery();

我不知道如何(而且在Hibernate Search的文档中找不到)为搜索searchTerm设置分析器。基本上,我开始手动拆分并在Java中将其设置为小写。但这似乎不正确。

我想要对我的查询词应用另一个分析器,例如:

@AnalyzerDef(name = "edgeNGram_query",// Replace accented characeters by their simpler counterpart (è => e,etc.)
                @TokenFilterDef(factory = LowerCaseFilterFactory.class) // Lowercase all characters
        })

您知道如何为查询字词设置自定义分析器,为什么认情况下不应用它?如果我搜索“ bouees”,它会起作用,但是如果我搜索“bouées”,则不会。

谢谢!

解决方案:

我的问题是,当我应该进行simpleQueryString查询时,我正在做keywordsimpleQueryString似乎没有在搜索词上运行分析器!然后,我只需要遵循@yrodiere .overridesForField( "description.values.value","edgeNGram_query" )即可使用正确的搜索词分析器。

解决方法

在Hibernate Search 5中,创建查询构建器时必须调用overridesForField,以覆盖每个字段的分析器:

QueryBuilder queryBuilder = fullTextEntityManager.getSearchFactory().buildQueryBuilder().forEntity(Hospital.class)
    .overridesForField( "title.value","edgeNGram_query" )
    .overridesForField( "keyword.values.value","edgeNGram_query" )
    .overridesForField( "description.values.value" )
    .get();

// Then it's business as usual
Query query = queryBuilder
        .simpleQueryString()
        .boostedTo(3f) // This whole query is boosted so exact matches will obtain a better score
        .onFields("title.value","keyword.values.value")
        .boostedTo(2f)
        .andField("description.values.value")
        //.withAndAsDefaultOperator()
        .matching(searchTerm)
        .createQuery();

另请参阅this answer的结尾,这可能是您最初获取代码的地方? :)

如果有一天您升级到Hibernate Search 6(在Beta中使用不同的API),您会发现它要简单得多:构建谓词时可以选择override the analyzer。例如:

List<MyEntity> hits = searchSession.search( MyEntity.class )
        .where( f -> f.simpleQueryString()
                .fields( "title.value","keyword.values.value" ).boost( 3f )
                .fields( "description.values.value" )
                .matching( searchTerm )
                 //.defaultOperator( BooleanOperator.AND )
                .analyzer( "edgeNGram_query" ) ) // <= HERE
        .fetchHits( 20 );

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...