问题描述
我们正在构建一个搜索引擎,从中我们可以从用户那里获得关于检索到的查询结果的相关性分数(1 到 5)。此外,我们希望利用反馈(具有相关性分数的结果)来改进查询结果。
到目前为止,我们已经构建了第一部分,即基于 BERT 的相似性搜索模型。现在,我们希望构建第二部分。任何人有任何想法,请分享。
解决方法
好吧,据我从您的描述中了解到,您对文档进行了 BERT
编码,当用户输入任何查询时,您对其进行 BERT 编码并找到与该查询相关的类似文档。
每当您执行相似性搜索操作时,根据您要检索的文档数量的配置,您会得到 1 个以上的结果。假设您有返回 10 个类似于用户查询的文档的设置。现在,如果用户已将其与第三个文档高度相关。下次您可能希望将该文档显示给第一个而不是第三个。
在这种情况下,您可以在数据库中维护一个表格,其中每个文档也包含分数。每当搜索引擎根据查询检索到文档时,您检查检索到的文档的相关性分数,并根据相关性重新排列并显示给用户。