问题描述
我有兴趣学习通过成对比较进行排名。在研究这个时,我发现 XGBoost 有一个名为 XGBRanker 的模型,它工作得很好。
我想知道 XGBRanker 如何管理训练数据以获得如此低的内存使用率和出色的结果?(我相信它使用 LambdamART)
我想它必须是某种功能的查找表,并且可能使迭代配对或不使用所有可能的排列与一组内的不同标签。
我尝试查看 source code,但所有内容都在引用其他一些 XGBoost 方法,到目前为止我还无法理解。
我想创建一种类似的方法来训练神经网络进行成对比较,但到目前为止,处理训练数据一直是一个巨大的障碍。
所以更一般地说,我的问题是:如何在成对排名算法中创建对?(RankNet、LambdaNet 等)是否使用所有对?只有一个百分比?有没有其他方法可以做到这一点?如果您正在处理超过 100.000 个项目,您将很容易进入数亿个范围。
我希望有人知道这方面的信息或知道谁可能。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)