问题描述
C:\XMLFiles\
in.blahblah.xml
out.blahblah.xml
in.blah.xml
out.blah.xml
我只需要返回没有“对应”的文件的结果。该文件夹包含数千个文件,文件名的“中心”部分是随机的……共同点是输入/输出和“.xml”。
有没有办法在 Powershell 中做到这一点?这是一个奇怪的问题。
谢谢。
解决方法
你的问题有点含糊。我希望我做对了。这是我的做法。
$dir = 'my_dir'
$singleFiles = [System.Collections.Generic.HashSet[string]]::new()
Get-ChildItem $dir -Filter '*.xml' | ForEach-Object {
if ($_.BaseName -match '^(?<prefix>in|out)(?<rest>\..+)') {
$oppositeFileName = if ($Matches.prefix -eq 'in') {
'out'
}
else {
'in'
}
$oppositeFileName += $Matches.rest + $_.Extension
$oppositeFileFullName = Join-Path $_.DirectoryName -ChildPath $oppositeFileName
if ($singleFiles.Contains($oppositeFileFullName)) {
$singleFiles.Remove($oppositeFileFullName) | Out-Null
}
else {
$singleFiles.Add($_.FullName) | Out-Null
}
}
}
$singleFiles
我正在从目录中获取所有 XML 文件并迭代结果。我检查文件的基本名称(文件的名称不包括目录路径和扩展名)是否与正则表达式匹配。正则表达式表示:如果名称以 in
或 out
开头,后跟至少 1 个字符,则匹配。
$Matches
自动变量包含匹配的组。基于这些组,我正在构建对应部分文件的名称:即,如果我目前在 in.abc
,我将构建 out.abc
。
之后,我正在构建文件对应部分文件的绝对路径,并检查它是否存在于 HashSet 中。如果是,我将其删除,因为这意味着在某些时候我迭代了该文件。否则,我将添加当前文件。
生成的 HashSet 将包含没有计数器部分的文件。
如果您需要更详细的解释,请告诉我,我会逐行进行。它可以稍微重构一下,但它可以完成工作。