有没有比列出目录中所有文件更快的方法来查找文件?

问题描述

我的工作流程如下:

for i in some_list:
    if i not in os.listdir(a_directory):
        x = do_something(i)
        x.to_pickle(f"{a_directory}/{i}")

os.listdir昂贵,因为目录很大,并且它位于网络文件系统上。

我有多个工作人员从事这项工作,所以我不能只列出目录内容一次。如果这样做,我的工人将重复他们的工作,而do_something毕竟比os.listdir贵。

是否有某种东西寻找特定文件的存在,而不是将所有文件都转储到python列表中以进行字符串匹配?

解决方法

根据以下问题,您可以直接检查文件是否存在:Check whether a file exists

从该答案开始:

import os.path
os.path.isfile(fname)

或者:

from pathlib import Path

my_file = Path("/path/to/file")
if my_file.is_file():
    # file exists