正则表达式 – 分隔符之间匹配文本：贪婪或惰性正则表达式？

对于在分隔符之间匹配文本的常见问题(例如<和>)，有两种常见的模式：

>以START [^ END] * END的形式使用贪心*或量词，例如或
使用懒惰*？要么？量词的形式为START。*？ END，例如< *取代。？

有一个特别的理由赞成一个在另一个？

一些优点：

[^>] *：

>更具表现力
>捕获换行符，不管/ s标志。
>考虑到更快，因为引擎不需要回溯找到一个成功的匹配(使用[^>]引擎没有做出选择 – 我们给它只有一种方法来匹配模式与字符串)。

。*？

>否“代码重复” – 结束字符只出现一次。>更简单的情况下，结尾分隔符多于一个字符长。 (在这种情况下，字符类不起作用)常见的替代方法是(？:(？！END))*。如果END分隔符是另一个模式，这会更糟。

相关文章