从 JSON 文件中提取字段，将其与纯文本文件匹配值进行比较，并从 JSON 文件中提取特定字段

问题描述

我有 file1.json 和纯文本 file2，其中使用 file2 值与 file.json 与匹配值 file2 进行比较，将有相应的字段在 file1.json 中是 CaseID，结果文件应包含这些值。我在下面提到了具有预期结果的案例。

我试图使用 awk 工具进行提取，但没有得到预期的答案

 awk -F,'FNR==NR {f2[$1];next} !($0 in f2)' file2 file1

file1.json

{
    "Cases": [{
            "CaseID": "100","CaseUpdatedByUser": "XYZ","Case": {
                "CaseName": "Apple","ID": "1"
            }
        },{
            "CaseID": "350","CaseUpdatedByUser": "ABC","Case": {
                "CaseName": "Mango",{
            "CaseID": "440","CaseUpdatedByUser": "PQR","Case": {
                "CaseName": "StrawBerry","ID": "1"
            }
        }
    ]
}

file2

Apple
StrawBerry
Mango

预期输出：

100
350
440

解决方法

如果您编写一个 extract.py 模块来帮助您获取所需的确切信息，那如何。

该模块非常灵活，因此可以作为模块导入到任何项目中。

我尝试过一个复杂而长的 json 文件，它工作得很好。

这个模块的代码是：

#extract.py

def json_extract(obj,key):
    arr = []

    def extract(obj,arr,key):
        if isinstance(obj,dict):
            for k,v in obj.items():
                if isinstance(v,(dict,list)):
                    extract(v,key)
                elif k == key:
                    arr.append(v)
        elif isinstance(obj,list):
            for item in obj:
                extract(item,key)
        return arr
    
    values = extract(obj,key)
    return values

为了进一步解释，这是原帖 ( URL ) 的 Extract Nested Data From Complex JSON。

使用 interface JustA { a: string; b: never; } interface JustB { a: never; b: string; } interface NeitherANorB { a: never; b: never; } type NotBothAAndB = JustA | JustB | NeitherANorB; function testMe(x: NotBothAAndB) { console.log(x); } testMe({}); // OK testMe({ a: "HI!" }); // OK testMe({ b: "SUP?" }); // OK testMe({ a: "HI!",b: "SUP?" }); // NOT OK、jq 和 awk：

sort

输出：

100
350
440

awk file-comparison json sed