一点正则表达式的学习碎片

1、主要作用:分割、匹配、查找、替换
2、正则表达式最少要包含一个原子。
3、PHP正则表达式函数
  • preg_match(mode,string subject,array matches)以perl语言为基础
  • ereg(mode,array regs)以POSIX基础
4、正则表达式的原子:
  1. a-z A-Z _ 0-9 //最常见的字符
  2. (abc) (skd) //单元符合,必须完全匹配
  3. [abcs] [^abd] //原子表,只要出现其中的元素就行,原子表中的^代表排除或相反内容
  4. 转义字符:
    1. \d 包含所有数字[0-9]
    2. \B 除所有数字外[^0-9]
    3. \w 包含所有常见字符[a-zA-Z_0-9]
    4. \W 除所有常见字符外[^a-zA-Z_0-9]
    5. \s 包含空白区域如回车、换行、分页等[\f\n\r]
5、正则表达式元字符:
* 匹配前一个内容的0次1次或多次
. 匹配内容的0次1次或多次,但不包括回车换行
+匹配前一个内容的1次或多次
?匹配前一个内容的0次或1次
| 选择匹配PHP中的|
^匹配字符串首部内容
$匹配字符串尾部内容
\b匹配单词边界,边界可以是空格或者特殊符合
\B匹配除带单词边界意外内容
{m}匹配前一个内容的重复次数为M次
{m,}匹配前一个内容的重复次数大于等于M次
{m,n}匹配前一个内容的重复次数M次到N次
()合并整体匹配,并放入内存,可以使用\1 \2 ……一次获取

6、运算顺序:
()圆括号是内存处理,优先级最高
* ? + {} 重复匹配内容其次
^ $ \b等边界处理第三
| 条件处理第四

7、模式修正符
i 正则内容在匹配的时候不区分大小写(认是区分的)
m 在匹配首内容或者尾内容时候才用多行识别匹配
S 将转义回车取消是为单行匹配(将多行视为一行)
x 忽略正则中的空白
A 强制从头开始匹配
D 强制$匹配尾部无任何内容
U 禁止贪婪匹配 只跟踪到最近的一个匹配符并结束

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...