java – 根据其中一个属性删除重复的JSON文件

我的 linux系统中有两个目录,/ dir和/ dir2

两者都有超过4000个JSON文件.每个文件JSON内容都是这样的

{
   "someattribute":"someValue","url":[
      "https://www.someUrl.com/xyz"
   ],"someattribute":"someValue"
}

请注意,url是一个数组,但它始终包含一个元素(url).

该URL使该文件唯一.如果/ dir和/ dir2中存在具有相同URL的文件,则它是重复的,需要将其删除.

我想优先使用shell命令自动执行此操作.任何意见我应该如何去做?

解决方法

使用 jq获取重复列表:

jq -nr 'foreach inputs.url[0] as $u (
    {}; .[$u] += 1; if .[$u] > 1 then input_filename else empty end
)' dir/*.json dir2/*.json

删除它们,请将命令输出上方的管道输出到xargs:

xargs -d $'\n' rm --

或者,为了与具有-0但不是-d的非GNU xargs兼容:

tr '\n' '\0' | xargs -0 rm --

请注意,文件名不得包含换行符.

相关文章

HashMap是Java中最常用的集合类框架,也是Java语言中非常典型...
在EffectiveJava中的第 36条中建议 用 EnumSet 替代位字段,...
介绍 注解是JDK1.5版本开始引入的一个特性,用于对代码进行说...
介绍 LinkedList同时实现了List接口和Deque接口,也就是说它...
介绍 TreeSet和TreeMap在Java里有着相同的实现,前者仅仅是对...
HashMap为什么线程不安全 put的不安全 由于多线程对HashMap进...