使用 apache_nifi 删除从数据库移动到 hdfs 的重复文件

问题描述

我在使用 apache nifi 时遇到问题,我想将数据从数据库移动到 hdfs。当我移动它时,我有一个表年份和一列,我发现很多文件包含相同的表年份。 我必须做些什么才能删除重复的文件 我已经使用了 updateattribute 处理器,但我不知道如何使用它来解决问题 enter image description here

this pic show the duplicated files with the same content in hdfs directory

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)