问题描述
我对根据缺失值的数据训练的partikit
加权条件树模型有问题。
我正在通过在每个周期为观察值赋予不同的整数权重来手动创建袋装树模型。
但是当我使用自举模型进行预测时,我注意到其中一些返回的值小于输入数据行。有趣的是,在输入数据的299行中,预测的数据长度为299或289。289是在删除具有缺失数据的预测变量之后的行数。
深入研究问题,我发现它是由三个组件的相互作用引起的:
- 在模型中使用权重;
- 预测变量中缺少数据;
- 在传递给
predict()
的输入数据中使用字符变量代替因子
如果仅缺少这三个条件之一,就不会出现问题,并且所有树都将返回299值。
以下是数据:https://www.dropbox.com/s/98oriv2msce4wu5/anonym_data.rds?dl=0 这是重现该问题的脚本:https://www.dropbox.com/s/5y7g2dwt2838pbp/test.R?dl=0
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)