Emacs Lisp 正则表达式规范

特殊字符

. * + ? [ ^ $ \

例如:

(string-match "^abc.e*?[0-9]$"  "abcdefg6") => t

特殊字符区间

[ 到之后第二个字符之后或第三个(第二个如果是 ^) 之后的]间的部分,叫做字符集(characters class).

`[[a]` 匹配 `[` 或 `a`

在 [: 到 :] 之间的字符集。这个和 Perl 相同

和 Perl Regexp Expression 的区别:

如果学过 Perl 的正则表达式,许多概念是相同的,就不介绍了,就说说不同的地方:

  1. 分支结构是用 \|,而不是 |,也就是说 | 不是一个特殊字符,转义之后才是。

  2. 表示匹配数量的区间的分界符也需要转义: \{3,4\},所以,{ 也不是特殊字符。

  3. 括号也不是特殊字符,对于分组的括号要进行转义;

    (string-match "(\w+)::\1" "abc:def") => t

  4. 非捕获型括号的定义 \(?:...\)

  5. 强制分组名称 `(?:digit...)

可以连续定义相同的分组,最后返回最后捕获的一个分组

\(?:2\w+\)::\(?:2\w+\)
  1. \` == \A 匹配文本的开始

  2. ' == \z 匹配文本的结束

正则表达式虽然广泛用于许多地方,但标准总有写差别。唉,学了一个一个。。

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...