问题描述
我正在尝试使用具有随机效应的线性混合模型的最佳线性无偏估计量 (BLUE) 来计算表型的调整平均值。
数据示例:
genotype | phenotype | environment
----------------------------------
A | 2 | 1
B | 50 | 1
C | 80 | 1
A | 3 | 2
C | 90 | 2
import statsmodels.formula.api as smf
md = smf.mixedlm("phenotype ~ genotype",data,groups=data['environment'])
mdf = md.fit()
print(mdf.summary())
我的数据给了我这个结果:
Mixed Linear Model Regression Results
==================================================================================
Model: MixedLM Dependent Variable: infected
No. Observations: 5248 Method: REML
No. Groups: 12 Scale: 208.6836
Min. group size: 298 Log-Likelihood: -20369.9517
Max. group size: 989 Converged: Yes
Mean group size: 437.3
---------------------------------------------------------------------------------
我有几个问题:
-
如何确定模型的准确性?
-
如何使用最佳线性无偏估计量提取调整后的平均值?
genotype | adjusted mean ------------------------ A | 2.2 B | 50? -> Only one value C | 86
-
Coef 是做什么的。总结报告的每个基因型告诉我?
Coef. Std.Err. z P>|z| [0.025 0.975] ---------------------------------------------------------------------------------- Intercept 64.313 4.754 13.528 0.000 54.995 73.631 Line_ID[B] -7.083 5.898 -1.201 0.230 -18.642 4.476 Line_ID[C] -57.167 5.898 -9.693 0.000 -68.726 -45.608
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)