正则表达式《精通正则表达式》笔记

概念

  1. 正则(regex):
    • 元字符+普通字符
  2. 字符组(Character Class):
    • [abc.?].?等需要转义的字符可以以字符组方式匹配
    • 字符组都是匹配一个字符

      g[.?]并不会匹配 g.?

  3. 字符组元字符(character-class Metacharacter):
    • [^0-5a-z]匹配大小写[Ss]qr
    • 匹配HTML TAG<H[1-5]>
    • ^不包含
    • [a|b]和(a|b)不同,前者|只是一个字符,后者则是”或”
  4. 单词分界(Word Boundaries)元字符序列(Metasequences):
    • <\word word\>
    • 匹配单词word开头的和word结尾的
    • \b单词分界 \bcat\b
  5. 括号及反向引用(Parentheses and Backreferences):
    • (abc)\1 \1开始引用 多个括号从左至右
      • PHP 使用引用需要转义,即preg_match('/(cat)\\1/',$str,$res)
  6. 环视(lookaround):
    环视和\b ^ $等一样只是匹配特定的位置。
    1. 肯定顺序环视(lookahead):
      • (?=h2ero)love you从左至右
    2. 肯定逆序环视:
      • (?<=h2ero)lover you从右至左

        分隔123456789为123.456.789,可以是preg_replace('/(?<=\d)(?=(\d\d\d)+$)/','.','123456789');也可以是preg_replace('/(?=\d)(?<=(\d\d\d)+$)/','123456789');两个环视的先后顺序不重要。只要在相同位置匹配即可。

    3. 否定顺序环视:
      • (?!h2ero)love you从左至右
    4. 否定逆序环视:
      • (?<!h2ero)lover you从右至左

拾遗

  1. ^cat$以字符阅读 第一个c开头 第二个a 第三个t结尾 而不是单词cat
  2. ^$匹配空行
  3. "[^"]*"匹配[]内的字符串

PHP中的正则

  1. 单引号转移\表示一个\所以\\才表示一个\
  2. 模式修饰符
    • i 忽略大小写
    • m 增强的行锚模式
    • s 点号通配模式
    • x 宽松排列和注释模式
    • u 以UTF-8读取正则表达式和目标字符
    • X 启用PCRE额外功能
    • e 将replacement作为PHP代码

      $metric=preg_replace(‘/(-?\d+(?:.\d+)?)/e’,’floor(($1-32)*5/9+0.5)’,$subject);

    • S 启用PCRE的study优化尝试
    • U 交换?的匹配优先含义
    • A 将整个匹配尝试锚定在起始位置
    • D $只能匹配锚定在起始位置
  3. preg_match中的RPEG_OFFSET_CAPTURE由于获取每次匹配的偏移量。preg_match_all中的PREG_SET_ORDER每次匹配集中保存。如果要设置多个参数用|连接。

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...