在elasticsearch中提取机器学习特征

问题描述

有没有办法从 ElasticSearch 返回文本匹配的原始信号?假设文档有 3 个文本字段 - 标题/正文/作者。我使用关键字查询执行搜索请求,并希望得到以下信号:

为了进一步概括这一点,有没有办法嵌入一些脚本,这些脚本可以直接计算给定(查询、文档)作为上下文的任何密集特征? (我知道无痛脚本 - https://www.elastic.co/guide/en/elasticsearch/reference/current/modules-scripting-painless.html - 但它似乎只允许访问文档字段,而不是查询/文档匹配信息)

上下文

一般来说,为了获得最佳的搜索/推荐质量,一种做法是进行多路径检索+混合,如下所示:

  • 在检索阶段,使用不同的策略(例如重写查询)从不同角度检索文档(有些倾向于正文匹配,有些倾向于作者姓名匹配,有些倾向于流行等)
  • 在混合阶段,来自不同检索策略的结果混合在一起,通常通过一个排名器对每个文档进行评分并按分数进行排名。

为了让排序器工作,我们需要有来自文本匹配的原始信号,以实现不同优化目标之间的最佳平衡。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...