问题描述
我有一个包含两列非唯一ID(分别为ID-A和ID-B)的数据集。
单个ID-A可以具有多个ID-B,反之亦然。我试图使用传递性(称为ID-C)生成第三个设置的标识符,该标识符对于具有ID-A或ID-B的所有记录都设置为相同的值。如果两个记录既没有ID-A也没有ID-B,则它们之间只有一条传递链,才能共享ID-C集标识符。
为直观起见,我有类似前两列的内容,并想生成第三列(ID-C)
ID-A ID-B ID-C
1 1 1
1 2 1
1 3 1
2 2 1
2 4 1
3 4 1
4 5 2
5 5 2
5 6 2
6 7 3
我在AWS Athena内使用Presto sql,所以我不能使用我知道的任何变量或循环。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)