问题描述
我有一个包含几个缺失值的数据集,需要使用变量“y”作为处理变量和 x1、x2 和 x3 作为调整变量运行倾向得分匹配。 通过在 Matchit 中使用以下代码
ModMatch <- matchit(y ~ x1+x2+x3,method = 'nearest',data = data)
我收到错误“数据中存在缺失值”
因此,我尝试使用小鼠进行多重插补:
ImputedDF <- mice(data)
ModMatch <- matchit(y ~ x1+x2+x3,data = ImputedDF)
并且我收到错误消息“无法将类 mids 的对象强制转换为数据帧”。 我可能需要一种打印估算数据框的方法,有人知道这是否可行吗?
解决方法
您应该使用 MatchThem
包,它是专门为在多次插补后执行匹配而设计的。 matchthem()
函数调用 matchit()
并在每个插补数据集中执行匹配。然后,您可以使用 cobalt
包检查估算数据集中的余额,该包旨在与 MatchThem
兼容。之后,您可以使用 with()
中的 MatchThem
函数来估计效果。以下是此工作流程的示例:
library(mice); library(MatchThem); library(cobalt)
#Impute the data with 20 imputations (more is better)
imp <- mice(data,m = 20)
#Perform matching within each imputation
ModMatch <- matchthem(y ~ x1+x2+x3,method = 'nearest',data = imp)
#Assess balance
bal.tab(ModMatch,un = TRUE)
love.plot(Modmatch)
#Estimate the effect
summary(pool(with(ModMatch,svyglm(outcome ~ y + x1 + X2 + X2))))
我要提醒您的是,您正在使用高级统计技术,未经高级培训的人不应使用这些技术。在 mice
和 MatchThem
中使用默认值很少是一个好主意。
关于您收到的错误消息:调用 mice()
的输出不是数据帧;它是一个 mids
对象。 data
中的 matchit()
参数需要一个数据框。 matchthem()
接受一个 mids
对象以在每个插补数据集中执行匹配。