具有多重插补的倾向得分匹配

问题描述

我有一个包含几个缺失值的数据集,需要使用变量“y”作为处理变量和 x1、x2 和 x3 作为调整变量运行倾向得分匹配。 通过在 Matchit 中使用以下代码

ModMatch <- matchit(y ~ x1+x2+x3,method = 'nearest',data = data)

我收到错误“数据中存在缺失值”

因此,我尝试使用小鼠进行多重插补:

ImputedDF <- mice(data)
ModMatch <- matchit(y ~ x1+x2+x3,data = ImputedDF)

并且我收到错误消息“无法将类 mids 的对象强制转换为数据帧”。 我可能需要一种打印估算数据框的方法,有人知道这是否可行吗?

解决方法

您应该使用 MatchThem 包,它是专门为在多次插补后执行匹配而设计的。 matchthem() 函数调用 matchit() 并在每个插补数据集中执行匹配。然后,您可以使用 cobalt 包检查估算数据集中的余额,该包旨在与 MatchThem 兼容。之后,您可以使用 with() 中的 MatchThem 函数来估计效果。以下是此工作流程的示例:

library(mice); library(MatchThem); library(cobalt)

#Impute the data with 20 imputations (more is better)
imp <- mice(data,m = 20)

#Perform matching within each imputation
ModMatch <- matchthem(y ~ x1+x2+x3,method = 'nearest',data = imp)

#Assess balance
bal.tab(ModMatch,un = TRUE)
love.plot(Modmatch)

#Estimate the effect
summary(pool(with(ModMatch,svyglm(outcome ~ y + x1 + X2 + X2))))

我要提醒您的是,您正在使用高级统计技术,未经高级培训的人不应使用这些技术。在 miceMatchThem 中使用默认值很少是一个好主意。

关于您收到的错误消息:调用 mice() 的输出不是数据帧;它是一个 mids 对象。 data 中的 matchit() 参数需要一个数据框。 matchthem() 接受一个 mids 对象以在每个插补数据集中执行匹配。