使用基于树的模型进行Boxcox转换具体为XGBoost

问题描述

我对boxcox转换(或对数转换)有疑问。我正在研究一个具有许多偏斜特征的数据集。现在,当我进行boxcox转换时,我得到了一个很好的分布,但是相关性降低了。现在,如果我正在使用线性模型,则只需考虑相关性即可决定是否应该转换特征。但是正如我提到的那样,我正在使用基于树的模型,因此应该对特征进行转换以使其分布更加分散,还是应该保留该特征以避免其相关性降低。

我为已转换和未转换的屏幕快照添加了分布及其与目标变量的关系的屏幕快照(左2绘制了原始特征和目标)。

PS:从图表中猜测,在我看来,如果我变换特征,则树将更容易为该特定特征找到分割。

非常感谢

Original Feature - BoxCox Transformed Feature

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...