使用 PDPBox 时显示掉落的假人

问题描述

我目前正在研究如何解释机器学习模型,我发现 PDPBox 包中的函数“pdp_plot”对于显示预测结果如何受到解释变量变化的影响非常有用。但是,我没有找到如何显示所有哑变量,包括在数据预处理步骤中丢弃的哑变量。

在我的初始数据集中,我有一个名为“Area”的解释变量,有 6 个唯一值:A、B、C、D、E、F。在创建虚拟变量并删除第一列后,用于训练我的 XGB 的数据集模型包括Area_B、Area_C、Area_D、Area_E、Area_F。

当使用PDPBox的'pdp_isolate'然后'pdp_plot'函数时,它显示了虚拟变量Area_B = 1的情况,然后是虚拟变量Area_C = 1的情况,然后是虚拟变量Area_D = 1的情况,等等. 但它没有显示所有这些虚拟变量 = 0 的情况的结果。有人也知道如何显示吗?

非常感谢您的时间。希望答案也能对社区有所帮助。如果需要澄清,请联系!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)