问题描述
我正在尝试在PowerShell中使用 Select-String 从文本文档中提取包含更改日志中条目的行。我在下面提供了一个示例。
PS命令Select-String "REAPER.*(19|20)" "d:\reaper 6.x versions.txt"
成功提取了每个日志条目的第一行(例如 REAPER v.6.11-2020年5月24日),但我还需要从每个条目中提取第二行。
我尝试过Select-String "REAPER.*(19|20)\n.*" "d:\reaper 6.x versions.txt"
和类似的方法,但是它们返回空白或错误。
陷入困境。 ?
REAPER v6.11 - May 24,2020
The Gone-Away World
Downloads:
Windows (12MB installer)
Windows x64 (13MB installer)
OS X Intel (18MB DMG)
OS X 64-bit Intel (20MB DMG)
OS X 64-bit Intel (20MB DMG,notarized for Catalina)
Linux x86_64 (11MB .tar.xz)
Linux i686 (11MB .tar.xz)
Linux armv7l (9MB .tar.xz)
Linux aarch64 (9MB .tar.xz)
Changes:
Appearance: add Theme Color Controls window for per-theme brightness/contrast/gamma/color adjustment
REAPER v6.10 - May 9,notarized for Catalina)
Linux x86_64 (11MB .tar.xz)
Linux i686 (11MB .tar.xz)
Linux armv7l (9MB .tar.xz)
Linux aarch64 (9MB .tar.xz)
Changes:
ara: preserve edits when user applies timing changes to media or imports as MIDI
解决方法
您可以使用
PS> Get-Content "d:\reaper 6.x versions.txt" -Raw | Select-String "REAPER.*(?:19|20)(?:\r?\n.*)?" -AllMatches | Foreach-Object { $_.Matches.Value }
REAPER v6.11 - May 24,2020
The Gone-Away World
REAPER v6.10 - May 9,2020
The Gone-Away World
注意:
-
Get-Content $file -Raw
将作为一个字符串而不是行数组读取整个文件,以便该模式可以在一个match操作中匹配多行 -
REAPER.*(?:19|20)(?:\r?\n.*)?
模式将从REAPER
到19
或20
匹配,然后匹配一个可选的CRLF或LF行结尾以及除零以外的任何零个或多个字符换行符。
要将相邻的两行输出为两列以输出到CSV,您可以使用
Get-Content "d:\reaper 6.x versions.txt" -Raw |
Select-String "(REAPER.*(?:19|20))(?:\r?\n([^\r\n]*))?" -AllMatches |
Foreach {$_.Matches} |
Foreach { new-object psobject -Property @{Tool=$_.Groups[1];Name=$_.Groups[2]} } |
Select Tool,Name |
Export-Csv -NoTypeInformation "d:\reaper 6.x versions.csv"
输出:
"Tool","Name"
"REAPER v6.11 - May 24,2020","The Gone-Away World"
"REAPER v6.10 - May 9,"The Gone-Away World"
,
如何使用-context?之前0行,之后1行:
Select-String "REAPER.*(19|20)" file.txt -Context 0,1
> file.txt:1:REAPER v6.11 - May 24,2020
file.txt:2:The Gone-Away World