问题描述
我正在尝试将String输入与以下条件匹配:
我认为最正确的正则表达式字符串是带有解释的:
String validRegex =
"^"+ # start of string
(?=.*[a-z].*[a-z].*[a-z])"+ # Ensure string has only 3 consecutive lowercase English letters
"(?=.*[0-9].*[0-9].*[0-9].*[0-9])"+ # Ensure string has only 4 digits representing year i.e. 2020
"(?=.*([0-9].*[0-9]) | ([0-9].*[0-9].*[0-9]) | ([0-9].*[0-9].*[0-9].*[0-9]))"+ # Ensure 10,100,or 100 digits
"(?=.*[0-9])"+ # Ensure last character is a digit 0-9
"(?=\\S+$)"+ # Ensure string has no whitespace
".{10,12}"+ # Entire string length must be from 10 through 12 characters
"$"; # end of string
是否有一种简单的方法来更新我的regex表达式,使我只能检测到唯一的连续字符?
解决方法
看:
- 整个输入(字符串)的长度始终为10到12个字符-
^.{10,12}$
(但是,在这种情况下,您不需要将其添加到整体模式中,因为以下所有部分的总和最多为字符串中允许的10、11或12个字符) - 前3个字符为唯一的小写英文字母(
[a-z]
)-^([a-z])(?!\\1)([a-z])(?!\\1|\\2)[a-z]
- 接下来的4个字符代表从1500年到2020年的当前年份,即2020 -
(?:1[5-9][0-9]{2}|20[01][0-9]|2020)
- 下一个字符只能是10个,100个或1000个(因此最少2个字符(即10个字符)或最多4个字符(即1000个字符))-{{1} }
- 最后一个字符将是0到9的数字-
[0-9]{2,4}
。
加入这些位,您将得到
[0-9]
请参见regex demo。
如果计划支持大小写字母,请在开头添加不区分大小写的修饰符String regex = "^([a-z])(?!\\1)([a-z])(?!\\1|\\2)[a-z](?:1[5-9][0-9]{2}|20[01][0-9]|2020)[0-9]{2,4}[0-9]$";
:
(?i)
如果结尾处可以有字母,而不仅仅是数字,则可以使用
String regex = "(?i)^([a-z])(?!\\1)([a-z])(?!\\1|\\2)[a-z](?:1[5-9][0-9]{2}|20[01][0-9]|2020)[0-9]{2,4}[0-9]$";
请参见this regex demo。
要创建正则表达式编号范围,可以使用gamon.webfactional.com或richie-bendall.ml或MyRegexTester.com等知名服务。
请参见Java demo:
String regex = "(?i)^([a-z])(?!\\1)([a-z])(?!\\1|\\2)[a-z](?:1[5-9][0-9]{2}|20[01][0-9]|2020)[0-9]{2,4}[0-9a-z]$";
输出:
String regex = "(?i)(([a-z])(?!\\2)([a-z])(?!\\2|\\3)[a-z])(1[5-9][0-9]{2}|20[01][0-9]|2020)([0-9]{2,4})([0-9a-z])";
String s = "AVG190420T";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(s);
if (matcher.find()){
System.out.println("Part 1: " + matcher.group(1));
System.out.println("Part 2: " + matcher.group(4));
System.out.println("Part 3: " + matcher.group(5));
System.out.println("Part 4: " + matcher.group(6));
} else {
System.out.println(s + " does not match the pattern.");
}
,
以下正则表达式不使用先行方式,但似乎可以通过初始要求更好地进行验证:
^(abc|bcd|cde|def|efg|fgh|ghi|hij|ijk|jkl|klm|lmn|mno|nop|opq|pqr|qrs|rst|stu|tuv|uvw|vwx|wxy|xyz)(1[5-9]\d{2}|20[0-1]\d|2020)10{1,3}\d$
第1 st 组(abc|bcd|...|xyz)
验证唯一连续的小写字母。
第2 nd 组验证年份:
(1[5-9]\d{2}|20[01]\d|2020)
比赛年份从1500到2020
剩余的数字后缀已验证:
-
10{1,3}
匹配10、100或100 -
\d
匹配结束数字
更新
对于1900..2019年,模式为(19\d{2}|20[01]\d)
对于10、20、50、100、200、500、1000之类的数字,格式为(10{1,3}|[25]0{1,2})