用新数据重新训练分类器会产生大量的类变化

问题描述

我每天都在 15 万条记录上训练 XGBoost 二进制分类器。 每天,大约有 500 条记录添加到训练集。 测试集(推理)10M 记录,无标签。 我注意到连续几天训练的两个模型对相同的记录(高达 10% 的推理数据)产生了根本不同的预测。 我现在尝试过的:

  1. 设置相同的种子和参数。
  2. 不同的分类器。

我担心的是,该模型的泛化程度不够,因此每日预测会发生重大变化。 我很想知道解决这个问题的可能方法

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)