正则表达式处理img标签

文章内容中包含有<img>标签内容,但有时候不需要显示图片,只需要显示内容,需要将内容中的图片替换掉,这个正则表达式,我可花了些时间,百度了一下,没有合适的,就自己费时间写了,

还可以用吧。 这里是java的,但正则表达式应该是一样的吧。

在网上找一段js的处理代码,异常简洁,相当好,这里和大家共享。

<script>

var content='${item.content}';
re = new RegExp("<(?!img|br|p|/p).*?>","g"); // 创建正则表达式对象。
r = content.match(re); // 在字符串 s 中查找匹配。
var contentValue = content.replace(/<[^>]+>/g,""); //去掉所有的html标记
if(contentValue.length>80){
contentValue=contentValue.substring(0,80)+"...";
}

</script>

以下是java代码:这里还真费了我不少脑筋,因为我们的文档发布者,总是从别处复制粘贴到编辑器里,带上了很多的各种复杂样式。在界面列表中,只显示一少部分内容,这时候需要对文档做处理之后再支截取少部分内容显示。不处理直接截取部分内容显示就有各种异常。

String content="<img src=\"http://192.168.1.162/upload/pu_68.jpg\" alt=\"\" />象个洋娃娃吗33333<img src=\"http://192.168.1.152/upload/33288.jpg\" alt=\"\" />888rrrrrr";

// String regex="<img\\s*([\\w]*=(\"|\')([^\"\']*)(\"|\')\\s*)*/>";//这样更简单
// String regex="<img\\s*src=(\"|\')([^\"\']+)(\"|\')\\s*([\\w]+=(\"|\')([^\"\']*)(\"|\')\\s*)*/>";
Pattern p = Pattern.compile("<img\\s*src=(\"|\')([^\"\']+)(\"|\')\\s*([\\w]+=(\"|\')([^\"\']*)(\"|\')\\s*)*/>");
Matcher m = p.matcher(content);
上面是单纯图片的,下面处理比较全面了。


String regex="<(img|a|p|b|div|br)\\s*([\\w]*=(\"|\')([^\"\'<]*)(\"|\')\\s*)*(/>|>)";
content=content.replaceAll(regex,"");
String regex2="<span\\s*([\\w]*=(\"|\')(([^\"\'/>><']*)(\"|\'))*\\s*)*(/>|>)";
content=content.replaceAll(regex2,"");
content=content.replaceAll("<(/a|b|/b|p|/p|/span|/div)>","");
content=content.replaceAll("\r|\n|\t|&nbsp;","");
if(content.length()>100){
content=content.substring(0,100)+"...";
}


System.out.println(content);

至此,可以基本满足需要了,虽然不能解决全部问题。

//<img\\s*([\\w]*=(\"|\')([^\"\']*)(\"|\')\\s*)*/>

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...