随机森林校准

问题描述

我正在尝试使用随机森林来解决分类问题,并且想知道单个特征的校准。例如,体育赛事中的主场优势等 2 级因素,我们可以肯定它对胜率的平均影响约为 +5%,并且数据中的任何其他特征都没有捕捉到它的影响。

似乎随机森林的性质(在每次拆分时选择 N 个随机特征来考虑)似乎不允许模型完全捕捉这样的任何一个特定特征的影响。将 max_features 参数设置为 None 或包含所有特征似乎可以解决问题,但随后就失去了树之间多样性的能力。

我想知道是否有任何好的方法可以根据我们对问题的某种领域知识来处理我们希望完全捕获的此类特征?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)