删除文件名不重复的文件

问题描述

对于每个文档(.pdf、.txt、.docx ecc),我还有一个相应的 json 文件文件名相同。

示例: 文件1.json, 文件1.pdf, file2.json, file2.txt,filex.json,filex.pdf,

但是我也得到了一些没有附带相应文档的json文件

我想删除所有没有对应文档的json文件。我真的卡住了,因为我找不到合适的解决方案来解决我的问题。

我知道如何 scandir() 从 pathinfo() ecc 获取文件名和扩展名。但问题是,对于我在目录中找到的每个 json 文件,我必须在该目录上执行另一个 foreach,不包括所有 json 文件,然后查看是否存在相同的文件名,以便我可以决定将其删除。 (这就是我想解决方法)。

这里的问题在于性能,因为有数百万个文件,对于每个 json,我必须对数百万个文件运行 foreach。

谁能指导我找到更好的解决方案?

谢谢!

编辑:因为没有人会在不先发布一段代码的情况下提供帮助(并且stackoverflow中的这种方法绝对是错误的),这就是我正在尝试的方式。:

<?PHP

$dir = "2000/";

$files = scandir($dir);

foreach ($files as $file) {

    $fullName = pathinfo($file);

    if ($fullName['extension'] === 'json') {
        if (!in_array($fullName['filename'].'.pdf',$files)){
            unlink($dir.$file);
        }
    }
}

现在如您所见,我只能搜索一种类型的文档(在本例中为 .pdf)。我想搜索.json 之外的每个扩展名,而且我不希望每个 json 文件都运行 foreach/in_array() 而是在一个 foreach 中实现所有这些。

解决方法

也许你应该换一种方式考虑?我的意思是,遍历所有文件,并尝试找到对应于 json 的文件,如果没有找到则将其删除。

看起来像这样:

$dir = "2000/";

foreach (glob($dir . "*.json") as $file) {
    $file = new \SplFileInfo($dir . $file);
    if (count(glob($dir . $file->getBasename('.' . $file->getExtension()) . ".*")) === 1) {
        unlink($dir . $file->getFilename());
    }
}

手册

PHP: SplFileInfo

PHP: glob