正则表达式之分组(捕获)、后向引用

正则表达式 2020-05-15

分组

正则表达式中的分组又称为子表达式，就是把一个正则表达式的全部或部分当做一个整体进行

处理，分成一个或多个组。其中分组是使用“（）”表示的。进行分组之后“（）”里面的内容就会被当

成一个整体来处理。

先看看一个具体的例子吧：

同时我们可以使用“（）”限制替换的范围

分组可以分为捕获组和非捕获组.

捕获组

可以通过从左到右通过其括号对其进行编号:

需要注意的是组零永远代表的是整个正则式,通过这样命名保存了匹配分组的匹配的序列，

捕获的子序列就可以通过后向引用在表达式中使用了，也可以从匹配器中检索。

至于后向引用其实就是对匹配组的一种快捷指令,用法后面会介绍.

非捕获组

以 (?) 开头的组是纯的非捕获 组，它不捕获文本，也不针对组合计进行计数。就是说，

如果小括号中以?号开头，那么这个分组就不会捕获文本，当然也不会有组的编号，因此

也不存在Back 引用。

测试匹配性 (?<!4)56(?=9) 这里的含义就是匹配后面的文本56前面不能是4，后面必须

是9组成。因此，可以匹配如下文本 5569 ，与4569不匹配。

后向引用

当一个正则表达式被分组后，每个组将会自动的分配一个组号用于代表该组的表达式，

其中，组号的编制规则为：从左到右、以分组的左括号“(”为标志，第一个分组的组号为1，

第二个分组的组号为2，以此类推。

反向引用提供查找重复字符组的方便的方法。它们可被认为是再次匹配同一个字符串的快捷指令。

如何理解呢？先看看一个例子吧。

1、匹配“javajava”

仅仅使用分组实现：(java)(java)

使用后向引用的方法：(java)\1

貌似上面也没看出啥区别呀，在来一个例子

2、直接对比(\w)\1和(\w)(\w)的区别

该正则匹配的是出现两次的字符.\1将重复匹配(\w）出现的内容！

该正则只是简单的匹配两个字符，注意区别！

再给个例子:

相关文章

正则替换html代码中img标签的src值

正则替换html代码中img标签的src值在开发富文本信息在移动端...

【C++】正则表达式

正则表达式

shell之三剑客awk基础用法

AWK是一种处理文本文件的语言，是一个强大的文件分析工具。它...

正则表达式

正则表达式是特殊的字符序列，利用事先定义好的特定字符以及...

Python基础知识进阶之正则表达式

Python界一名小学生，热心分享编程学习。

开发者神器，代码文档终于有救了

收集整理每周优质开发者内容，包括、、等方面。每周五定期发...