问题描述
我有一个数据集,其中包含列col1,col2,col3,col4,col5。我希望col1作为因变量,而其他作为自变量。我将如何创建公式? 我正在这样创建。 我很困惑?
import statsmodels.api as sm
from statsmodels.formula.api import ols
model = ols('anovaData["col1"] ~ anovaData["?"]',data=anovaData).fit()
Edit1: 我将所需的列放在列表中,并将ols作为自变量。效果很好,但是我想要的格式不是必需的。
y = [col2,col3,col4,col5]
model = ols('anovaData["col1"] ~ anovaData[y]',data=anovaData).fit()
====================================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------------
Intercept -0.0177 0.013 -1.319 0.190 -0.044 0.009
anovaData[y][0] 0.0003 0.001 0.211 0.833 -0.002 0.003
anovaData[y][1] -0.0007 0.000 -3.829 0.000 -0.001 -0.000
anovaData[y][2] 0.0032 0.001 2.853 0.005 0.001 0.005
anovaData[y][3] -0.0008 0.000 -2.162 0.032 -0.002 -7.22e-05
想要的是
====================================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------------
Intercept -0.0177 0.013 -1.319 0.190 -0.044 0.009
col2 0.0003 0.001 0.211 0.833 -0.002 0.003
col3 -0.0007 0.000 -3.829 0.000 -0.001 -0.000
col4 0.0032 0.001 2.853 0.005 0.001 0.005
col5 -0.0008 0.000 -2.162 0.032 -0.002 -7.22e-05
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)