使用线性混合模型和最佳线性无偏估计器计算调整均值

问题描述

我正在尝试使用具有随机效应的线性混合模型的最佳线性无偏估计量 (BLUE) 来计算表型的调整平均值。

数据示例:

genotype | phenotype | environment
----------------------------------
A        | 2         | 1
B        | 50        | 1
C        | 80        | 1
A        | 3         | 2
C        | 90        | 2

生成一个模型:

import statsmodels.formula.api as smf
md = smf.mixedlm("phenotype ~ genotype",data,groups=data['environment'])
mdf = md.fit()
print(mdf.summary())

我的数据给了我这个结果:

                  Mixed Linear Model Regression Results
==================================================================================
Model:                     MixedLM         Dependent Variable:         infected   
No. Observations:          5248            Method:                     REML       
No. Groups:                12              Scale:                      208.6836   
Min. group size:           298             Log-Likelihood:             -20369.9517
Max. group size:           989             Converged:                  Yes        
Mean group size:           437.3                                                  
---------------------------------------------------------------------------------

我有几个问题:

  1. 如何确定模型的准确性?

  2. 如何使用最佳线性无偏估计量提取调整后的平均值?

    genotype | adjusted mean
    ------------------------
    A        | 2.2
    B        | 50? -> Only one value
    C        | 86
    
  3. Coef 是做什么的。总结报告的每个基因型告诉我?

                                    Coef.  Std.Err.    z    P>|z|  [0.025  0.975]
     ----------------------------------------------------------------------------------
     Intercept                      64.313    4.754  13.528 0.000  54.995  73.631
     Line_ID[B]                     -7.083    5.898  -1.201 0.230 -18.642   4.476
     Line_ID[C]                     -57.167    5.898  -9.693 0.000 -68.726 -45.608
    

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)