正则表达式 – 分隔符之间匹配文本:贪婪或惰性正则表达式?

对于在分隔符之间匹配文本的常见问题(例如<和>),有两种常见的模式:

>以START [^ END] * END的形式使用贪心*或量词,例如或
使用懒惰*?要么 ?量词的形式为START。*? END,例如< *取代。?

一个特别的理由赞成一个在另一个

一些优点:

[^>] *:

>更具表现力
>捕获换行符,不管/ s标志。
>考虑到更快,因为引擎不需要回溯找到一个成功的匹配(使用[^>]引擎没有做出选择 – 我们给它只有一种方法来匹配模式与字符串)。

。*?

>否“代码重复” – 结束字符只出现一次。>更简单的情况下,结尾分隔符多于一个字符长。 (在这种情况下,字符类不起作用)常见的替代方法是(?:(?!END))*。如果END分隔符是另一个模式,这会更糟。

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...