不使用 BY(id) 的数据步合并

问题描述

我需要使用数据步骤合并两个数据集,如下所示:

Data have1;
x=1; output;
x=2; output;
x=3; output;
Run;

Data have2;
y = 'A';
z = 'B';
Run;

Data want;
Merge have1 have2;
Run;

结果应该如下:

x   y   z
1   A   B
2   A   B
3   A   B

但是,当我运行合并 SAS 时只合并第一行并给我以下内容

x   y   z
1   A   B
2   
3   

我知道这可以使用左连接来完成,但是为了处理完整数据集中的变量,我更喜欢通过合并来完成。请问有人可以帮忙吗?

解决方法

变量Z从何而来?我想这可能就是你想要的。

Data want;
   set have1;
   if _n_ eq 1 then set have2;
   Run;
,

为了解释发生了什么,当您从数据集中引入数据并“用完”行时,SAS 正在做什么,它将来自该数据集的所有变量设置为缺失。当您执行 set a b(同一 set 语句上的两个数据集),或 merge a b 没有 BYset a; set b; 时,可能会发生这种情况,尽管数据步骤将在第一个在后一种情况下,数据集用完了行,所以没关系。

为什么@data_null_ 的代码有效,是这样的

if _n_ eq 1 then set b;

从不尝试拉出不存在的行!它拉第一排,然后停止尝试拉。由于来自 setmerge 的所有变量都会自动保留,因此即使在数据步骤循环的第一次迭代之后,这些值也会保留(只要您不更改它们)。