在信息检索中学习排名与强化学习-哪个更可取，为什么？

我正在尝试创建一个信息检索系统，该系统可以从用户反馈（通过隐式，例如点击数据）或显式（例如，对不相关建议结果的二进制反馈）中受益。

更具体地说，我的计划是使用ElasticSearch索引通过提供候选相关结果的“存储桶”来减少空间，然后通过可以从反馈中受益的更复杂的ML模型在存储桶中对结果重新排序（如上所述，它们都是隐式和显式的。

我的感觉是，对于ML组件，我应该使用“学习排名”方法，但是其他同事建议我应该去学习强化学习。

我想知道您对此事有何看法，即上述两种方法（学习排名与强化学习）中的哪一种似乎与任务更相关？

非常感谢。

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）