如何分析 R 中插补输出的有用性

问题描述

我正在处理一个包含 3,500 个观测值的数据集,其中包含一个体重指数变量。 BMI 变量有大约 300 个 NA 值,我使用多重插补法进行了插补。抱歉,这是不可重现的,不知道在这种情况下如何快速做到这一点。这是我用来估算数据的代码

a1 <- amelia(x = df,m = 30,idvars = c("EDUC_1","REGION_3"),noms=c("REGION_1","REGION_2","REGION_4","SMOKE","MARRIED","NON_WHITE","MOD_SEV_ANX","HYPERTEN","DIABETES","BELOW_100_POVERTY","IMMIGRANT","FEMALE","EDUC_2","EDUC_3","EDUC_4","EDUC_5"),p2s = 0)
a1
imp.mod <- zelig(BMICALC ~ AGE+FAMSIZE+factor(BELOW_100_POVERTY)+factor(IMMIGRANT)
                  +factor(FEMALE)+factor(EDUC_2)+factor(EDUC_3)
                  +factor(EDUC_4)+factor(EDUC_5)+factor(REGION_1)+factor(REGION_2)+factor(REGION_4)+
                   factor(SMOKE)+factor(MARRIED)+factor(NON_WHITE)+factor(MOD_SEV_ANX)+factor(HYPERTEN)+
            factor(DIABETES),model = "ls",data = a1,cite = F)
summary(imp.mod)

这是输出

enter image description here

从此 website here 我找到了有关如何解释插补是否需要更多调查,或者我是否可以使用回归模型继续分析数据的信息。我已经包含了根据网站说明创建 2 个视觉效果代码,但我不清楚如何解释插补是否准确。第一张图中的两个分布是否需要接近?有人可以澄清第二张图片中 y=x 线和蓝色置信区间/点的含义吗?这里的输出是否表明插补是否足以用于回归分析?我在下面附上了代码输出。谢谢!

compare.density(a1,var = "BMICALC")

enter image description here

overimpute(a1,var = "BMICALC")

enter image description here

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)