特征选择和低 Pearson's R

问题描述

我正在尝试进行特征选择过程,因为 df 中有 +100 列。

当输入'n_features_to_select=1'时,RFE建议将特征A作为最佳特征。

问题在于y特征A间的Pearson R 仅为0.1, 这似乎太低而无法解释y。然而,仅特征A整个特征间的预测分数几乎相似,这意味着特征A可以构成一个好的模型。

那么,特征选择和 Pearson's R 之间有什么关系吗?高 Pearson's R 不保证应该选择该功能吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)