问题描述
在下面的示例中-这是一个固定长度的文件,我希望查找以“ 10”开头并在以后的9个位置处具有“ M”的任何行。找到这些类型的记录后,我只需要用Test一词替换名字,然后在35个位置中找到。
10123456789M 00002345678 Tom Jones 123 Main St
10123456789A 00002345678 Debra Sally 123 Main St
20123456789M 00002345678 Michael Sampson 123 Main St
10123456789M 00002345678 Jonathan Smith 123 Main St
到目前为止,我可以在FIND和REPLACE中使用以下正则表达式实现此目的
^(10(?:.{9}M).{35})(.*?)
(\1)TEST
我遇到的问题是它是一个固定长度的文件,使用上面的文件会弄乱以下地址数据的起始位置。看到下面是我的结果。是否可以使用Notepad ++中的Regex在固定长度文件中查找和替换可变长度值?
在此先感谢您的帮助!
10123456789M 00002345678 TEST Jones 123 Main St
10123456789A 00002345678 Debra Sally 123 Main St
20123456789M 00002345678 Michael Sampson 123 Main St
10123456789M 00002345678 TEST Smith 123 Main St
解决方法
我接受了Patrick的回答,因为似乎我的特定问题没有在记事本++中使用正则表达式的解决方案。就是说,我最终在我的情况下做了一些不同的事情,所以我想分享,以防其他人偶然发现类似的问题。
由于名称字段在姓氏后填充了多余的空格,因此我决定保留姓氏,并使用以下内容替换姓氏。假设全名不超过特定长度,否则无论如何您都会遇到麻烦。
^(10(?:.{9}M).{35})((.*?) ).{12}
(\1)(\2)TESTLASTNAME
结果:
10123456789M 00002345678 Tom TESTLASTNAME 123 Main St
10123456789A 00002345678 Debra Sally 123 Main St
20123456789M 00002345678 Michael Sampson 123 Main St
10123456789M 00002345678 Jonathan TESTLASTNAME 123 Main St
,
正则表达式不太适合该确切目的。我想出的最接近您可以使用的功能是:
(^10.{9}M.{35}).{5}
\1TEST_
(使用空格代替_)
获得
不幸的是,这会破坏名称。本质上,您将所有捕获的名称捕获到\1
中,而不捕获接下来的5个。然后,将所有内容替换为捕获的所有内容+测试+空间:\1TEST
10123456789M 00002345678 TEST ones 123 Main St
10123456789A 00002345678 Debra Sally 123 Main St
20123456789M 00002345678 Michael Sampson 123 Main St
10123456789M 00002345678 TEST han Smith 123 Main St
,
你的正则表达式非常正确,只是你错过了 \w+
并替换为什么你用 ()
捕获它
以下是您的正则表达式的修复,
查找内容:^(10(?:.{9}M).{35})(.*?)\w+
替换为:$1Test
或 \1Test