python – 如何工作git ls-files脚本

怎么看看git ls-files的脚本?
是否可以修复索引文件或从corupted索引文件中提取文件列表?
也许可以使用正则表达式?最好是在python 2.7.6中

最佳答案
根据腐败程度,这可能是也可能不可行. Git的数据结构和相关工具更适合于检测腐败而不是修复它.

特别是,索引本身不是存储库的一部分,它是从当前内容派生的,因此在大多数情况下,最好删除它并执行git reset以重新创建它.无论谁读到你的问题,都可能想知道你的存储库是如何进入该状态的.

考虑到这一点,这里有几个想法:

索引的最后20个字节是到该点为止的文件内容的sha1.如果那些已损坏,您可以使用十六进制编辑器覆盖它们.

~$python3
>>> data = open('.git/index','rb').read()
>>> data[-20:].hex()
'e211d8f60209ca8571c2acc73f9a24ef523b5fa3'
>>> hashlib.sha1(data[:-20]).hexdigest()
'e211d8f60209ca8571c2acc73f9a24ef523b5fa3'

这可以解决由脑损伤工具引起的简单损坏.

如果你真的想从一个完全损坏的索引文件中恢复任何东西,你可能想要:

>在参考实现中阅读index-format.txt.
>查看libgit2中的parse_index例程.
>查看索引文件导致的特定错误.
>小心地修补该例程,以便在不崩溃的情况下继续处理坏数据.

另一种方法可能是使用strings实用程序,如果您只想查看文件名列表.您将丢失相关的二进制信息(并且某些二进制信息将包含可打印的ASCII垃圾).

相关文章

使用OpenCV实现视频去抖 整体步骤: 设置输入输出视频 寻找帧...
前言 对中文标题使用余弦相似度算法和编辑距离相似度分析进行...
前言 之前尝试写过一个爬虫,那时对网页请求还不够熟练,用的...
前言 本文使用Python实现了PCA算法,并使用ORL人脸数据集进行...
前言 使用opencv对图像进行操作,要求:(1)定位银行票据的...
天气预报API 功能 从中国天气网抓取数据返回1-7天的天气数据...