我想使用数据集创建一个Anova表,该数据集具有一个从属列,另一个作为独立列

问题描述

我有一个数据集,其中包含列col1,col2,col3,col4,col5。我希望col1作为因变量,而其他作为自变量。我将如何创建公式? 我正在这样创建。 我很困惑

import statsmodels.api as sm
from statsmodels.formula.api import ols
model = ols('anovaData["col1"] ~ anovaData["?"]',data=anovaData).fit()

Edit1: 我将所需的列放在列表中,并将ols作为自变量。效果很好,但是我想要的格式不是必需的。

y = [col2,col3,col4,col5]
model = ols('anovaData["col1"] ~ anovaData[y]',data=anovaData).fit()
====================================================================================
                       coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------------
Intercept           -0.0177      0.013     -1.319      0.190      -0.044       0.009
anovaData[y][0]      0.0003      0.001      0.211      0.833      -0.002       0.003
anovaData[y][1]     -0.0007      0.000     -3.829      0.000      -0.001      -0.000
anovaData[y][2]      0.0032      0.001      2.853      0.005       0.001       0.005
anovaData[y][3]     -0.0008      0.000     -2.162      0.032      -0.002   -7.22e-05

想要的是

====================================================================================
                       coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------------
Intercept           -0.0177      0.013     -1.319      0.190      -0.044       0.009
col2                 0.0003      0.001      0.211      0.833      -0.002       0.003
col3                -0.0007      0.000     -3.829      0.000      -0.001      -0.000
col4                 0.0032      0.001      2.853      0.005       0.001       0.005
col5                -0.0008      0.000     -2.162      0.032      -0.002   -7.22e-05

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)