问题描述
我很难通过两次家庭调查找到适合我想做的事情的正确方法。我有两个数据集:
- 包含社会经济信息 (A1) 和 Z 信息的 X 数据集
- 包含社会经济信息的 Y 数据集 (A2)
Y 数据集没有 Z 信息,这是我想根据 X 数据集估算的。插补/匹配将基于社会经济信息(A1 和 A2)。哪种方法最好?我研究了带有 MAR 选项的 MI,它们使用混合方法多重插补,但这种方法基于这样一个事实,即您从 SAME 总体中插补缺失值。我不太确定是否可以将这种方法用于我的数据。
如果我的例子太抽象了,那么考虑一下:我有两个家庭调查数据集。 X 有食物、衣服和房屋燃料的支出,但 Y 数据集没有,所以我需要估算这些信息。我可以这样做,因为我在两个数据集中都有与收入、家庭规模、电器所有权等相关的信息。因此,如果数据集 X 和 Y 中这些社会经济特征的边际分布相似,我就可以估算支出数据。
我非常感谢任何帮助 - 即使是 STATA 中可用的命名方法或工具也会非常有帮助!
干杯,
玛尔塔
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)