确定正则表达式是否是另一个的子集

我有一个大的正则表达式的集合,当匹配调用一个特定的http处理程序。一些旧的正则表达式是不可达的(例如a.c *⊃abc *),我想修剪它们。

是否有一个库,给了两个正则表达式会告诉我,如果第二个是第一个的子集?

我不知道这是可以决定的(它闻起来像停止问题,一个不同的名字)。但事实证明it’s decidable

Trying to find the complexity of this problem lead me to this paper.

问题的正式定义可以在这里找到:这通常被称为包含问题

The inclusion problem for R,is to test for two given expressions r,r′ ∈ R,
whether r ⊆ r′.

这篇文章有一些伟大的信息(总结:所有,但最简单的表达式是相当复杂),然而搜索关于包含问题的信息直接一个回到StackOverflow的答案已经有一个链接到a paper describing a passable polynomial time algorithm应该覆盖很多常见的情况。

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...