零长度正则表达式和无限匹配?

在试图详细说明 this问题的答案时,我现在试图接受零长度正则表达式的行为/含义.

我经常使用www.regexr.com作为操场来测试/调试/理解正则表达式中发生的事情.

所以我们有这个最平庸的场景:

正则表达式是*

输入字符串是dgwawa
(事实上​​,这里的字符串是无关紧要的)

为什么报告此正则表达式将无限匹配的行为,因为它匹配前一个字符的零次出现?

为什么结果不能是6个匹配,每个字符位置一个(因为在每个字符,无论是否是a,都有匹配,因为零匹配是匹配的)?

它是如何进入无限匹配的?所以它不会一次检查/进行一个角色?

我想知道它是如何/在哪里进入无限循环.

regexr.com在线正则表达式测试程序专为JavaScript正则表达式测试而设计.当传递与空字符串匹配的模式时,JavaScript正则表达式引擎不会自动移动索引.

这就是为什么当您需要模拟.NET Regex.Matches,PHP preg_match_all,Python re.finditer等中观察到的行为时,您需要手动推进索引以测试每个位置.

regex101.com test

var re = /a*/g; 
var str = 'dgwawa';
var m;
 
while ((m = re.exec(str)) !== null) {
    if (m.index === re.lastIndex) {   // <- this part
        re.lastIndex++;               // <- here
    }                                 // <- is important
    document.body.innerHTML += "'" + m[0] + "'<br/>";
}

如果删除if块,则会得到无限循环.

关于这方面,有两件非常重要的事情需要提及:

>始终使用适当的在线正则表达式测试程序来编写您的编程语言>避免使用可以匹配空字符串的非锚定模式

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...