将二进制文件读入结构

问题描述

使用struct模块; 您需要以该库记录的字符串格式定义类型:

struct.unpack('=HHf255s', bytes)

上面的示例期望本机字节顺序,两个无符号短裤,一个浮点数和一个255个字符的字符串。

要遍历一个已经完全读取的bytes字符串,我要使用itertools; 我在这里一个方便的石斑鱼食谱

from itertools import izip_longest, imap
from struct import unpack, calcsize

fmt_s = '=5i'
fmt_spec = '=256i'
size_s = calcsize(fmt_s)
size = size_s + calcsize(fmt_spec)

def chunked(iterable, n, fillvalue=''):
    args = [iter(iterable)] * n
    return imap(''.join, izip_longest(*args, fillvalue=fillvalue))

data = [unpack(fmt_s, section[:size_s]) + (unpack(fmt_spec, section[size_s:]),)
    for section in chunked(bytes, size)]

这将产生元组而不是列表,但是如果必须进行调整,就很容易进行调整:

data = [list(unpack(fmt_s, section[:size_s])) + [list(unpack(fmt_spec, section[size_s:]))]
    for section in chunked(bytes, size)]

解决方法

我有一个具有已知格式/结构的二进制文件。

如何将所有二进制数据读入结构的数组中?

类似于(用伪代码)

bytes = read_file(filename)
struct = {'int','int','float','byte[255]'}
data = read_as_struct(bytes,struct)
data[1]
>>> 10,11,10.1,Arr[255]

编辑:

到目前为止的解决方案:

data = []

fmt   = '=iiiii256i'
fmt_s = '=iiiii'
fmt_spec = '256i'

struct_size = struct.calcsize(fmt)

for i in range(struct_size,len(bytes)-struct_size,struct_size):
    dat1= list(struct.unpack(fmt_s,bytes[i-struct_size:i-1024]))
    dat2= list(struct.unpack(fmt_spec,bytes[i-1024:i]))
    dat1.append(dat2)
    data.append(dat1)