在信息检索中学习排名与强化学习-哪个更可取,为什么?

问题描述

我正在尝试创建一个信息检索系统,该系统可以从用户反馈(通过隐式,例如点击数据)或显式(例如,对不相关建议结果的二进制反馈)中受益。

更具体地说,我的计划是使用ElasticSearch索引通过提供候选相关结果的“存储桶”来减少空间,然后通过可以从反馈中受益的更复杂的ML模型在存储桶中对结果重新排序(如上所述,它们都是隐式和显式的。

我的感觉是,对于ML组件,我应该使用“学习排名”方法,但是其他同事建议我应该去学习强化学习。

我想知道您对此事有何看法,即上述两种方法(学习排名与强化学习)中的哪一种似乎与任务更相关?

非常感谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)