问题描述
我正在尝试进行特征选择过程,因为 df 中有 +100 列。
当输入'n_features_to_select=1'时,RFE建议将特征A作为最佳特征。
问题在于y 和特征A 之间的Pearson R 仅为0.1, 这似乎太低而无法解释y。然而,仅特征A与整个特征之间的预测分数几乎相似,这意味着特征A可以构成一个好的模型。
那么,特征选择和 Pearson's R 之间有什么关系吗?高 Pearson's R 不保证应该选择该功能吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)