1.概述
这是三部分实用BM25系列中关于相似度排名(相关性)的第一个帖子。下一篇文章链接在底部。
背景
在Elasticsearch 5.0中,我们将Okapi BM25作为默认的相似度算法,这是用于对与查询相关的结果进行评分的算法。我不会在这篇博客中过多地介绍BM25与其他方法的对比,但如果你想了解BM25的理论论证,你可以跳转到Elastic{on} 2016的BM25解神秘化演示。相反,我将为您介绍BM25的实际用法,包括可用的参数和影响评分的因素。
请记住,这个博客主要是为文本文档评分的。也就是说,它真正专注于帮助我们的搜索用户。如果您正在为日志或指标建立索引,并返回按某个明确的元数据/数字顺序(如时间戳)排序的结果,那么这个博客主要是为了满足您的好奇心。