如何使用R中的MICE包来估算丢失的数据?

问题描述

我有一个关于2000个观测值的数据集,以进行进一步的分析。有4个变量的缺失值很多(缺失百分比超过50%)。我正在尝试使用MICE包来估算缺失值。这是我的问题:

  1. 对于最终数据集,它包含先前来自不同数据集的变量。我应该使用最终数据集来估算这些变量的缺失值,还是应该使用原始数据集(这四个变量来自何处),而原始数据集的数据与这四个变量更相关?

  2. 我在网上看到了两个不同的代码:

imputed_Data <- mice(iris.mis,m=5,maxit = 50,method = 'pmm',seed = 500)
completeData <- complete(imputed_Data,2)

另一个:

mice(anesimp2,maxit = 5,predictorMatrix = predM,method = meth,print =  FALSE)

我想知道这两个代码之间有什么区别,应该使用哪一个。如果使用第一个代码,我也想知道在我的情况下应该设置种子的什么值。

  1. 在运行这些代码之前,我应该对数据进行任何预处理吗?

非常感谢您的帮助!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...