问题描述
我想实现一个功能来监视目录并在从 Internet 下载新文件时执行一些操作,但发现很难确定文件是否已完全下载,有没有办法做到这一点?
>解决方法
通常显示文件哈希的工具会给出文件的状态 - 这应该与另一个文件的哈希进行比较 - 如果相同,则我们知道该文件已成功下载。
md5(bsd 原生)可用 - 但仅适用于本地文件 -
如果您通过 HTTP 检索远程文件,那么没有先下载文件就无法获取文件的哈希值(无论是 STDOUT 还是管道传输到文件,使用 wget -O- 或 curl )>
如果文件主机有第二个文件,其中包含正在下载的文件的 md5 哈希值 - 那么本地下载的哈希值的比较与文件提供者提供的哈希值相当。
要做任何更时髦的事情都需要编写一个全面的程序 - 例如这个问题和接受的答案的组合: Python Compare local and remote file MD5 Hash
,除了 MD5,还有一种简单的方法可以做到这一点:
部分下载的文件通常有一个临时文件名,完全下载后将重命名为原始文件名。您可以让您的程序忽略或仅监视某些文件扩展名。