方法问题:使用 STATA 基于两个数据集进行匹配/插补

问题描述

我很难通过两次家庭调查找到适合我想做的事情的正确方法我有两个数据集:

  1. 包含社会经济信息 (A1) 和 Z 信息的 X 数据集
  2. 包含社会经济信息的 Y 数据集 (A2)

Y 数据集没有 Z 信息,这是我想根据 X 数据集估算的。插补/匹配将基于社会经济信息(A1 和 A2)。哪种方法最好?我研究了带有 MAR 选项的 MI,它们使用混合方法多重插补,但这种方法基于这样一个事实,即您从 SAME 总体中插补缺失值。我不太确定是否可以将这种方法用于我的数据。

如果我的例子太抽象了,那么考虑一下:我有两个家庭调查数据集。 X 有食物、衣服和房屋燃料的支出,但 Y 数据集没有,所以我需要估算这些信息。我可以这样做,因为我在两个数据集中都有与收入、家庭规模、电器所有权等相关的信息。因此,如果数据集 X 和 Y 中这些社会经济特征的边际分布相似,我就可以估算支出数据。

我非常感谢任何帮助 - 即使是 STATA 中可用的命名方法或工具也会非常有帮助!

干杯,

玛尔塔

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)