问题描述
我每天都在 15 万条记录上训练 XGBoost 二进制分类器。
每天,大约有 500 条记录添加到训练集。
测试集(推理)10M 记录,无标签。
我注意到连续几天训练的两个模型对相同的记录(高达 10% 的推理数据)产生了根本不同的预测。
我现在尝试过的:
- 设置相同的种子和参数。
- 不同的分类器。
我担心的是,该模型的泛化程度不够,因此每日预测会发生重大变化。
我很想知道解决这个问题的可能方法
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)