从JSON字节数组将字节获取到Python

问题描述

我正在处理一个后处理应用程序,其中,在另一个基于C#的应用程序中,我将字节数组存储到列表中,然后将所述列表保存到JSON文件中。在这方面一切似乎都可以解决,当我在另一个C#应用程序中重新打开字节数组时,读入和解释数据没有问题。让我头疼的地方是将数据带入python脚本中以进行处理。正确提取了json文件,但是字节数据格式却很奇怪,我无法解释

import json

packetTypeDict = {"TxRx":0xABCD,"Cfg":0xA5A1}

def get_dictionary_from_json(jsonFilePath):
    with open(jsonFilePath) as f:
        jsonData = json.load(f)     
    return jsonData    

def parse_json_file(jsonFilePath):
    dataDict = get_dictionary_from_json(jsonFilePath)
    parse_data_list(dataDict["dataList"])

def parse_data_list(dataList):
    print(len(dataList))
    #flatten the list
    dataListFlat = [item for sublist in dataList for item in sublist]
    print(len(dataListFlat))
    print(dataListFlat)
    
if __name__ == "__main__":
    dataDict = parse_json_file(r"test.json")

运行此命令时,最终会在print语句(以及调试器)的输出获取值,这些值似乎与C#中看到的值不匹配。 “ print(dataListFlat)命令的输出最终是从字符串列表中生成的,因此输出看起来像这样

['z','a','s','4','A','E',...

在进入JSON之后和之后用C#表示的同一数组看起来像这样

[0]: 0xcd,[1]: 0xab,[2]: 0x38,[3]: 0x00,[4]: 0x01,[5]: 0x00,[6]: 0x00,[7]: 0x00...

我正在寻找哪种格式。 此外,JSON文件中的数据与python输出中的数据完全一样

"dataList":["zas4AAEAAAAyvgotABAQAAAAAAAAAAAA...

最终,C#实现可以访问将dataList定义为字节数组列表的源类,而python方面则不具备此知识。因此,我认为有某种方法可以将该数据转换为字节,但是我对所发生的事情有些茫然。我已经研究过使用解压缩,将其转换为字节以及任何其他方法。我尝试过的一切似乎都没有效果。此外,在python输出和C#输出之间确实没有明显的模式。显然,这是因为Newtonsoft JSON处理相同的字符串没有问题。

解决方法

当然,我在发布后不久便找到了答案。研究了JSON如何编码字节(尤其是byte []),并发现了blog post,在这里讨论了它们通常默认编码为base64。能够在数据包展平之前使用以下代码对字节数组进行解码

base64.b64decode(dataList[0])

这正确地转换了与C#中的JSON反序列化方法的输出匹配的单个数组。 enter image description here enter image description here