Java正则表达式积极向前看,但仅匹配唯一字符?

问题描述

我正在尝试将String输入与以下条件匹配:

  1. 一个字符为唯一小写英文字母
  2. 一个字符是代表当前年份(从1500年到2020年)
  3. 一个字符只能是10或100或1000
  4. 最后一个字符将是0到9的数字

我认为最正确的正则表达式字符串是带有解释的:

String validRegex = 
"^"+                                    # start of string
(?=.*[a-z].*[a-z].*[a-z])"+             # Ensure string has only 3 consecutive lowercase English letters
"(?=.*[0-9].*[0-9].*[0-9].*[0-9])"+     # Ensure string has only 4 digits representing year i.e. 2020
"(?=.*([0-9].*[0-9]) | ([0-9].*[0-9].*[0-9]) | ([0-9].*[0-9].*[0-9].*[0-9]))"+ # Ensure 10,100,or 100 digits
"(?=.*[0-9])"+                          # Ensure last character is a digit 0-9
"(?=\\S+$)"+                             # Ensure string has no whitespace
".{10,12}"+                              # Entire string length must be from 10 through 12 characters
"$";                                     # end of string

是否有一种简单的方法来更新我的regex表达式,使我只能检测到唯一的连续字符?

解决方法

看:

  • 整个输入(字符串)的长度始终为10到12个字符-^.{10,12}$但是,在这种情况下,您不需要将其添加到整体模式中,因为以下所有部分的总和最多为字符串中允许的10、11或12个字符)
  • 前3个字符为唯一的小写英文字母([a-z]-^([a-z])(?!\\1)([a-z])(?!\\1|\\2)[a-z]
  • 接下来的4个字符代表从1500年到2020年的当前年份,即2020 -(?:1[5-9][0-9]{2}|20[01][0-9]|2020)
  • 下一个字符只能是10个,100个或1000个(因此最少2个字符(即10个字符)或最多4个字符(即1000个字符))-{{1} }
  • 最后一个字符将是0到9的数字-[0-9]{2,4}

加入这些位,您将得到

[0-9]

请参见regex demo

如果计划支持大小写字母,请在开头添加不区分大小写的修饰符String regex = "^([a-z])(?!\\1)([a-z])(?!\\1|\\2)[a-z](?:1[5-9][0-9]{2}|20[01][0-9]|2020)[0-9]{2,4}[0-9]$";

(?i)

如果结尾处可以有字母,而不仅仅是数字,则可以使用

String regex = "(?i)^([a-z])(?!\\1)([a-z])(?!\\1|\\2)[a-z](?:1[5-9][0-9]{2}|20[01][0-9]|2020)[0-9]{2,4}[0-9]$";

请参见this regex demo

要创建正则表达式编号范围,可以使用gamon.webfactional.comrichie-bendall.mlMyRegexTester.com等知名服务。

请参见Java demo

String regex = "(?i)^([a-z])(?!\\1)([a-z])(?!\\1|\\2)[a-z](?:1[5-9][0-9]{2}|20[01][0-9]|2020)[0-9]{2,4}[0-9a-z]$";

输出:

String regex = "(?i)(([a-z])(?!\\2)([a-z])(?!\\2|\\3)[a-z])(1[5-9][0-9]{2}|20[01][0-9]|2020)([0-9]{2,4})([0-9a-z])";
String s = "AVG190420T";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(s);
if (matcher.find()){
    System.out.println("Part 1: " + matcher.group(1));
    System.out.println("Part 2: " + matcher.group(4));
    System.out.println("Part 3: " + matcher.group(5));
    System.out.println("Part 4: " + matcher.group(6));
} else {
    System.out.println(s + " does not match the pattern.");
}
,

以下正则表达式不使用先行方式,但似乎可以通过初始要求更好地进行验证:

^(abc|bcd|cde|def|efg|fgh|ghi|hij|ijk|jkl|klm|lmn|mno|nop|opq|pqr|qrs|rst|stu|tuv|uvw|vwx|wxy|xyz)(1[5-9]\d{2}|20[0-1]\d|2020)10{1,3}\d$

Online demo

第1 st (abc|bcd|...|xyz)验证唯一连续的小写字母

第2 nd 组验证年份: (1[5-9]\d{2}|20[01]\d|2020)比赛年份从1500到2020

剩余的数字后缀已验证:

  • 10{1,3}匹配10、100或100
  • \d匹配结束数字

更新
对于1900..2019年,模式为(19\d{2}|20[01]\d) 对于10、20、50、100、200、500、1000之类的数字,格式为(10{1,3}|[25]0{1,2})

Updated online demo