问题描述
我最近正在对数据集进行回归分析。我使用了statsmodels包中的OLS函数。
我首先为所有类别变量创建了虚拟变量,然后删除了相关系数为0.9或更高的所有变量。
现在,我在数据中运行了OLS函数,并以Total Charges作为响应变量,将所有其他变量作为回归变量。我有很多重要的变量。我如何解释这个模型。 我应该删除所有这些变量吗?在这种情况下,我将只剩下很少的变量。
它还表明存在多重共线性,但是我删除了确实提供了0.9以上相关值的所有类别和变量。
这是数据集
这是编码数据
这是模型输出
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)