问题描述
我刚开始研究 rd 设计,有一个关于固定效应的问题。假设我有一个带有结果变量 y 的数据框 df(几年内在 100 个地区中观察到),运行变量 x。我希望用“因子”变量“地区”来解释地区固定效应
根据我指定 covs
的方式,两者给出的估计值大不相同:
我用过——
rdrobust(df$y,df$x,covs=cbind(df$district),c=0,all=TRUE)
-- 和 --
blocks.d = model.matrix(~df$district+0)
rdrobust(df$y,covs=blocks.d,all=TRUE)
--基于我看到的答案(上面链接),但令人费解的是这两种方法的结果有何显着不同。使用 covs
是控制固定效果的正确方法吗?如果是这样,上述哪种方法更好?我尝试浏览 rdrobust
文档,但不幸的是无法弄清楚
解决方法
如果我正确理解您的数据,您的第一种方法使用地区列表作为协变量,而第二种方法使用指标集,如果您想包含固定效应,这将是正确的方法。