从 JSON 文件中提取字段,将其与纯文本文件匹配值进行比较,并从 JSON 文件中提取特定字段

问题描述

我有 file1.json 和纯文本 file2,其中使用 file2 值与 file.json 与匹配值 file2 进行比较,将有相应的字段在 file1.json 中是 CaseID,结果文件应包含这些值。我在下面提到了具有预期结果的案例。

我试图使用 awk 工具进行提取,但没有得到预期的答案

 awk -F,'FNR==NR {f2[$1];next} !($0 in f2)' file2 file1

file1.json

{
    "Cases": [{
            "CaseID": "100","CaseUpdatedByUser": "XYZ","Case": {
                "CaseName": "Apple","ID": "1"
            }
        },{
            "CaseID": "350","CaseUpdatedByUser": "ABC","Case": {
                "CaseName": "Mango",{
            "CaseID": "440","CaseUpdatedByUser": "PQR","Case": {
                "CaseName": "StrawBerry","ID": "1"
            }
        }
    ]
}

file2

Apple
StrawBerry
Mango

预期输出

100
350
440

解决方法

如果您编写一个 extract.py 模块来帮助您获取所需的确切信息,那如何。

该模块非常灵活,因此可以作为模块导入到任何项目中。

我尝试过一个复杂而长的 json 文件,它工作得很好。

这个模块的代码是:

#extract.py

def json_extract(obj,key):
    arr = []

    def extract(obj,arr,key):
        if isinstance(obj,dict):
            for k,v in obj.items():
                if isinstance(v,(dict,list)):
                    extract(v,key)
                elif k == key:
                    arr.append(v)
        elif isinstance(obj,list):
            for item in obj:
                extract(item,key)
        return arr
    
    values = extract(obj,key)
    return values

为了进一步解释,这是原帖 ( URL ) 的 Extract Nested Data From Complex JSON

,

使用 interface JustA { a: string; b: never; } interface JustB { a: never; b: string; } interface NeitherANorB { a: never; b: never; } type NotBothAAndB = JustA | JustB | NeitherANorB; function testMe(x: NotBothAAndB) { console.log(x); } testMe({}); // OK testMe({ a: "HI!" }); // OK testMe({ b: "SUP?" }); // OK testMe({ a: "HI!",b: "SUP?" }); // NOT OK jqawk

sort

输出:

100
350
440