是否可以编写一个使用分组但不进行回溯的正则表达式引擎?

问题描述

我正在尝试详细了解 redos 并且或多或少清楚为什么 (a|a)+xaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaab 字符串上失败,但我很好奇是否有任何示例不使用分组?我读到 Thompson 引擎 is not vulnerable 解决这个问题,因为它不进行回溯,但据我所知,这意味着它也不能进行分组。是否可以在不回溯的情况下进行分组以及随之而来的漏洞?

解决方法

好的,根据 Wiktor Stribiżew 的说法,答案是 Re2。可以在不回溯的情况下支持分组。 Re2 不支持反向引用之类的东西,这是完全可以理解的,至少我怀疑许多引擎是否为这样的模式准备了 /(a)(a|\1)+b/.test("aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaax")。他们写道,因此也不完全支持环视。所以这些引擎有局限性,但它们已经足够好了。许多人试图用单一模式解决所有问题,这加剧了这个问题。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...