西比|统计:迭代变量选择根据 AdjR2 添加或删除特征:回归

问题描述

我正在开展一个项目,研究 夜间价格 在 airbnb 数据集上的预测效果。我的数据已经过完全预处理,我选择了感兴趣的特征。

最终,找一篇以代码为例的论文,前提是你有任何可用的链接

enter image description here

enter image description here

总共有 24 列,因此有 23 个因变量和 1 个自变量 price

我想根据变量如何影响 Adj R2 在我的模型中添加删除变量,并且只希望在改进 Adj R2 时保留感兴趣的特征。

我的目标是在用户定义的函数下完成这个任务:

df=[]
predictors= [] #features
target=[]  # price
alpha=[]  

def variable_selection (df,predictors,target,alpha)
   return pred

事情是,我想从一个变量回归模型开始,然后从 predictors 添加一个特征,然后添加导致 AdjR2 增加最大的特征。然后添加一个等第四个,直到没有增加 AdjR2 的变量为止。

非常感谢您走到这一步。祝你一切顺利

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)