减少具有多对多关系的两列ID

问题描述

我有一个包含两列非唯一ID(分别为ID-A和ID-B)的数据集。

单个ID-A可以具有多个ID-B,反之亦然。我试图使用传递性(称为ID-C)生成第三个设置的标识符,该标识符对于具有ID-A或ID-B的所有记录都设置为相同的值。如果两个记录既没有ID-A也没有ID-B,则它们之间只有一条传递链,才能共享ID-C集标识符。

为直观起见,我有类似前两列的内容,并想生成第三列(ID-C)

ID-A  ID-B  ID-C
1     1     1
1     2     1
1     3     1
2     2     1
2     4     1
3     4     1
4     5     2
5     5     2
5     6     2
6     7     3

我在AWS Athena内使用Presto sql,所以我不能使用我知道的任何变量或循环。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)