根据用户相关性反馈改进文本搜索?

问题描述

我们正在构建一个搜索引擎,从中我们可以从用户那里获得关于检索到的查询结果的相关性分数(1 到 5)。此外,我们希望利用反馈(具有相关性分数的结果)来改进查询结果。

到目前为止,我们已经构建了第一部分,即基于 BERT 的相似性搜索模型。现在,我们希望构建第二部分。任何人有任何想法,请分享

解决方法

好吧,据我从您的描述中了解到,您对文档进行了 BERT 编码,当用户输入任何查询时,您对其进行 BERT 编码并找到与该查询相关的类似文档。

每当您执行相似性搜索操作时,根据您要检索的文档数量的配置,您会得到 1 个以上的结果。假设您有返回 10 个类似于用户查询的文档的设置。现在,如果用户已将其与第三个文档高度相关。下次您可能希望将该文档显示给第一个而不是第三个。

在这种情况下,您可以在数据库中维护一个表格,其中每个文档也包含分数。每当搜索引擎根据查询检索到文档时,您检查检索到的文档的相关性分数,并根据相关性重新排列并显示给用户。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...