python中的二进制文件IO,从哪里开始?

问题描述

正如您在问题中所指出的,您可能应该从struct模块开始,当然,请以二进制文件形式打开文件

基本上,您只是从文件的开头开始,然后将其逐段拆分。这是一个麻烦,但不是一个大问题。如果文件被压缩或加密,事情会变得更加困难。如果您从一个知道其内容文件开始,这对您很有帮助,这样您就不必一直猜测。

尝试一下,也许您会提出更具体的问题。

解决方法

作为一名自学成才的python爱好者,我将如何学习使用标准格式导入和导出二进制文件?

我想实现一个脚本,该脚本接受ePub电子书(zip中的XHTML + CSS)并将其转换为Mobipocket(Palmdoc)格式,以允许Amazon
Kindle读取它(作为我的一个较大项目的一部分,我正在努力)。

已经有一个很棒的用于管理电子书库的开源项目:Caliber。我想尝试将其作为学习/自学练习独自实现。我开始查看他们的python源代码,意识到我不知道发生了什么。当然,自学成才的最大危险就是不知道自己不知道的东西。

在这种情况下,我知道我对这些二进制文件以及如何在python代码(struct?)中使用它们知之甚少。但是我想我可能通常会缺少很多关于二进制文件的知识,并且我希望获得一些帮助以了解如何使用它们。
这是mobi /
palmdoc标头的详细概述。谢谢!

编辑:没问题,好点!您对如何获得使用二进制文件的基本知识有任何建议吗?特定于Python可能会有所帮助,但其他方法也可能会有用。

TOM:编辑为问题,添加了简介/更好的标题