问题描述
我正在构建一个脚本,该脚本将访问大量文件并提取特定字符串以分配为变量。
所有文件中的字符串都相似,这不是问题。我能够使这个过程作为一个单独的事件起作用(定义一个单一的源文件)
$hostname_import = select-string .\test.txt -Pattern 'hostname ABC-.+'
$hostname = $hostname_import -replace '.+ ',''
以上将输出目标文件中标识的特定主机名(第二个功能是修剪单词主机名和空格)然后我可以使用它继续根据需要使用变量来执行各种操作。
我遇到的问题是在 foreach 循环中执行此函数,以便我可以获取初始文件 - 执行选择字符串函数(或类似函数),然后按预期在循环中执行数据修改。
对于上下文 - 我正在查看配置文件 - 并基于这些配置构建一个单独的文件来报告发现 - 报告构建的一部分需要设备的主机名。
--编辑 1: 在咨询了我的橡皮鸭后,我将尝试将这些文件作为 CSV 导入,以便可能找到解决方案。
巨大的帮助!
解决方法
Select-String
可以通过其 -Path
或 -LiteralPath
参数直接处理多个文件,作为路径的数组和/或作为通配符表达式。
它不支持传递目录路径以处理其中的文件(更不用说递归),因此您将拥有管道Get-ChildItem
(可能带有 -Recurse
)到 Select-String
调用的结果。
以下示例使用后一种技术,循环遍历当前目录子树中的所有 *.config
文件:
Get-ChildItem -File -Recurse -Filter *.config |
Select-String -Pattern 'hostname ABC-(.+)' |
ForEach-Object {
$sourceFilePath = $_.Path
$hostName = $_.Matches[0].Groups[1].Value
}
注意在正则表达式模式中使用捕获组 ((...)
),它允许通过 Select-String
输出的 Microsoft.PowerShell.Commands.MatchInfo
实例仅从整体匹配中提取感兴趣的子字符串.这消除了对 -replace
操作的需要;详情见底部。
请注意,每个文件可能会报告多个匹配项;如果您知道只有一个(或者只对第一个感兴趣),请将 -List
添加到 Select-String
调用以加快操作.
如何仅提取匹配行/行部分的text(字符串):
当您在 string 上下文(例如 Select-String
)中直接使用 Microsoft.PowerShell.Commands.MatchInfo
输出对象(类型为 -replace
)时,如果给出了文件参数,则结果字符串表示包含更多而不仅仅是行文本,因为输入文件路径被添加到行文本之前,后跟 {{1} };例如::
要仅提取行文本,直接将其作为字符串,使用 C:\path\to\file.config:hostname ABC-foo
属性。
- 注意:在 PowerShell (Core) 7+ 中,您现在可以通过传递
.Line
开关让Select-String
直接输出字符串(匹配行)。
要仅提取正则表达式匹配的行的-Raw
属性(如果还传递了用于文字子串匹配的 .Matches
开关),如上所示。
-
-SimpleMatch
是System.Text.RegularExpressions.Match
实例的集合(如果传递了.Matches
开关,则只能有 多个 元素),{{ 1}} 每个属性包含与整个模式匹配的 text。 -
如果
-AllMatches
正则表达式包含 捕获组 (.Value
),每个-Pattern
实例的(...)
集合 - 本身由 { {1}} 个实例 - 包含这些组捕获的内容,从索引Match
开始;.Groups
属性再次包含捕获的文本。
听起来您需要一个 Get-ChildItem
来获取文件夹中的所有文件,然后将输出通过管道传输到 Foreach-Object
循环,该循环将引用每个文件。
请注意,我添加了 -recurse
开关,以防您也需要获取子文件夹文件。
尝试以下操作:
Get-Childitem -path "C:\PathToFolder" -recurse | Foreach-Object {
$hostname_import = select-string $_.Fullname -Pattern 'hostname ABC-.+'
$hostname = $hostname_import -replace '.+ ',''
# The rest of your logic goes here
}