正则表达式基础应用(切割split(regex))

1. 基础字符串切割

要求:

按照空格将字符串切割

String a = "asd adsf asdf dfkajsd yyy";
String reg1 = " +"; //1个或多个空格切割
String[] val = a.split(reg1);
for(String v : val){
System.out.println(v);
}


2. 按照特殊字符切割

要求:

按照点将字符串切割

特别说明:

在正则表达式中,. 为特殊字符,所以必须转义\. ,而在java字符串中\ 如果想正常表示也需要转义,就成为\\.

String b = "abc.sd.s.ldj.l44.sd";
String reg2 = "\\.";
String[] val1 = b.split(reg2);
for(String v : val1){
System.out.println(v);
}


3.按照叠词完成切割,为了规则的结果可以被重用

要求:

按照有重复的字符串切割

特别说明:

正则表达式中()中的内容表示一个组,而组后面跟上\1 表示组的编号,此处表示重用组里规则过滤出来的值,这个就叫叠词

String c = "sdflddfkdfguuuflglglhlsgfaszzdk";
String reg3 = "(.)\\1+"; // 组里为任意字符,\\1为重用组里过滤出来的值,+表示多次利用组里规则过滤出来的值
String [] val2 = c.split(reg3);
for(String v : val2){
System.out.println(v);
}



补充:

如下面正则表达式: ((a(b))(c))

怎么判断它是几个组呢?

答: 只要数它有几个左括号或者几个右括号就行了,这里是4个组;

那么怎么知道组的编号了?

答:从左至右数左括号,第一个就是第一组,一次类推。


总结补充:这个正是正则表达式的一个缺点,就是符号定义越多,正则越长,阅读行越差。说白了就是越牛的正则表达式越难看明白。

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...