特征选择和低 Pearson's R

我正在尝试进行特征选择过程，因为 df 中有 +100 列。

当输入'n_features_to_select=1'时，RFE建议将特征A作为最佳特征。

问题在于y 和特征A 之间的Pearson R 仅为0.1， 这似乎太低而无法解释y。然而，仅特征A与整个特征之间的预测分数几乎相似，这意味着特征A可以构成一个好的模型。

那么，特征选择和 Pearson's R 之间有什么关系吗？高 Pearson's R 不保证应该选择该功能吗？

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）