Java正则表达式如何匹配特定html标签内的内容

这篇文章主要给大家介绍了关于Java正则表达式如何匹配特定html标签内的内容的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

如题:

使用正则表达式,怎么匹配特定html标签内的内容

比如,对于如下文本串:

... ignored content

prefix content

inner content

postfix content

... ignored content

标签内的内容: inner content(这里的html标签可以换成任何其它的标签,比如

标签

这里引入正则表达式的group概念:详细点击文章查看

比如:对于一个正则表达式( ( A ) ( B ( C ) ) )

group 1为:( ( A ) ( B ( C ) ) )

group 2为:( A )

group 3为:( B ( C ) )

group 4为:( C )

这样,我们就能够构造出如下的正则表达式:.*()(.*)2).*

此表达式的group概念为:

group 1: ()(.*)2)

group 2: (html>)

group 3: (.*)

显然我们要求的就是group3的内容

注意:2是对group2的引用,也就是html>

该正则表达式也可以写成: .*()(.*)(html>)).* 化简其实就是.*(.*).*

代码实现为:

String p = ".*()(.*)\2).*";>午休abcpostfix"; System.out.println("Pattern: " + p); System.out.println("String to be test: " + m); Pattern pattern = Pattern.compile(p); Matcher matcher = pattern.matcher(m); if(matcher.matches()) { System.out.println("Matched String: " + matcher.group(3)); } else { System.out.println("So sad, not matching anything!"); }

总结

相关文章

HashMap是Java中最常用的集合类框架,也是Java语言中非常典型...
在EffectiveJava中的第 36条中建议 用 EnumSet 替代位字段,...
介绍 注解是JDK1.5版本开始引入的一个特性,用于对代码进行说...
介绍 LinkedList同时实现了List接口和Deque接口,也就是说它...
介绍 TreeSet和TreeMap在Java里有着相同的实现,前者仅仅是对...
HashMap为什么线程不安全 put的不安全 由于多线程对HashMap进...