c – 放在二进制数据文件头文件中

我有一个模拟读取我们创建的大型二进制数据文件(10到100的GB).我们以速度为由使用二进制.这些文件是系统依赖的,从我们运行的每个系统上的文本文件转换,所以我不关心可移植性.目前这些文件是用fwrite编写的POD结构体的许多实例.

我需要更改结构体,所以我想添加一个文件版本号的头,随着结构的改变,它将被增加.由于我这样做,我想添加一些其他信息.我正在考虑结构体的大小,字节顺序,也可能是创建二进制文件代码的svn版本号.还有什么其他有用的可以添加吗?

解决方法

根据我的经验,第二次猜测你需要的数据总是浪费时间.重要的是以可扩展的方式构建元数据.对于 XML文件,这是直截了当的,但二进制文件需要更多的思考.

我倾向于将元数据存储在文件结尾的结构中,而不是开始.这有两个优点:

>截断/未终止的文件
容易检测.
>元数据页脚往往可以
附加到现有文件没有
影响他们的阅读代码.

我使用的最简单的元数据页脚看起来像这样:

struct MetadataFooter{
  char[40] creatorVersion;
  char[40] creatorApplication;
  .. or whatever
} 

struct FileFooter
{
  int64 MetadataFooterSize;  // = sizeof(MetadataFooter)
  char[10] magicString;   // a unique identifier for the format: maybe "MYFILEFMT"
};

在原始数据之后,元数据页脚和THEN文件页脚都被写入.

当读取文件时,寻求endofof(FileFooter).阅读页脚,并验证magicString.然后,根据MetadataFooterSize查找并读取元数据.根据文件中包含的页脚大小,可以为缺少的字段使用认值.

正如KeithB指出的,您甚至可以使用这种技术将元数据作为XML字符串存储,从而提供完全可扩展的元数据的优点,具有二进制数据的紧凑性和速度.

相关文章

本程序的编译和运行环境如下(如果有运行方面的问题欢迎在评...
水了一学期的院选修,万万没想到期末考试还有比较硬核的编程...
补充一下,先前文章末尾给出的下载链接的完整代码含有部分C&...
思路如标题所说采用模N取余法,难点是这个除法过程如何实现。...
本篇博客有更新!!!更新后效果图如下: 文章末尾的完整代码...
刚开始学习模块化程序设计时,估计大家都被形参和实参搞迷糊...