如何删除父表中的重复/重复数据并使用 KNIME 或 EXCEL 替换子表中的唯一值?

问题描述

我在 Customer 表(CSV 格式的父表)中有数据,这个文件有带有唯一键的客户冗余数据。我只需要保留一个客户记录,根据我保留的记录,将其键替换为 CSV 文件中所有子表(假设在本例中为 CustomerHistory 表)。

示例:

客户示例:

客户 ID FName LName
101 瑞克 史密斯
102 瑞克 史密斯
103 瑞克 史密斯
201 六月 罗伯特
202 六月 罗伯特
301 四月 石灰石
302 约翰 琼斯
303 约翰 琼斯
404 约翰 琼斯
501 约翰 琼斯
601 八月 漂亮

子表:

CustomerHistory 表:

CustHistID 客户 ID
1001 101
1002 101
1003 102
1004 103
1005 103
1006 103
1007 201
1008 202
1009 202
1010 301
1011 302
1012 303
1013 404
1014 501
1015 601
1017 404
1018 301
1019 303
1020 404

修正后的预期结果应该是

客户表:

客户 ID FName LName
101 瑞克 史密斯
201 六月 罗伯特
301 四月 石灰石
302 约翰 琼斯
601 八月 漂亮

子表:

CustomerHistory 表:

CustHistID 客户 ID
1001 101
1002 101
1003 101
1004 101
1005 101
1006 101
1007 201
1008 201
1009 201
1010 301
1011 302
1012 303
1013 303
1014 301
1015 601
1017 303
1018 301
1019 303
1020 303

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)