我的目标是在并行线程中压缩相同源的数据.
我已经定义了列表中的作业,这些作业具有读取信息(每个作业中500kb-1MB).
我已经定义了列表中的作业,这些作业具有读取信息(每个作业中500kb-1MB).
我的压缩器线程将使用ZLIB压缩每个块的数据并将其存储在相应作业的outbuf中.
现在,我想合并所有这些并创建一个标准ZLIB格式的输出文件.
从ZLIB RFC和浏览了pigzee的来源后,我明白了
ZLIB标题如下所示
+---+---+ |CMF|FLG| (2 bytes) +---+---+ +---+---+---+---+ | DICTID | (4 bytes. Present only when FLG.FDICT is set) +---+---+---+---+ +=====================+ |...compressed data...| (variable size of data) +=====================+ +---+---+---+---+ | ADLER32 | (4 bytes of variable data) +---+---+---+---+
就我而言,也没有字典.
所以当我组合两个压缩单元时,所有单元的标题都是相同的.
因此,我正在做以下的操作.
>对于第一个单元,我正在编写标头压缩数据.
>对于最后一个单元的第二个单元,我只写了压缩数据(没有标题和没有预告片)
>完成所有单元后,我使用adlrer32_combine()并将所有作业输出数据的校验和转换为最终的一个adler 32,然后我在底部更新输出文件.
但问题是,我在deflate期间收到错误,说某些地方的数据无效.
有人已经尝试过这样的事吗?任何相关信息都会非常有用.