php 正则去除网页所有的 html,js,css,注释的简单示例

对php使用正则去除网页中所有的 html,js,css,注释感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧!

/**
 * php使用正则去除网页中所有的 html,注释
 *
 * @param 
 * @arrange 512-笔记网: jb51.cc
 **/
$search = array ('<script[^>]*?>.*?</script>'si,// 去掉 javascript
'<style[^>]*?>.*?</style>'si,// 去掉 css
'<[/!]*?[^<>]*?>'si,// 去掉 HTML 标记
'<!--[/!]*?[^<>]*?>'si,// 去掉 注释 标记
'([rn])[s]+',// 去掉空白字符
'&(quot|#34);'i,// 替换 HTML 实体 
'&(amp|#38);'i,'&(lt|#60);'i,'&(gt|#62);'i,'&(nbsp|#160);'i,'&(iexcl|#161);'i,'&(cent|#162);'i,'&(pound|#163);'i,'&(copy|#169);'i,'&#(d+);'e); // 作为 PHP 代码运行
$replace = array (,,\1,\,&,<,>, ,chr(161),chr(162),chr(163),chr(169),chr(\1));
//$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
$out = preg_replace($search,$replace,$document);
/***   来自编程之家 jb51.cc(jb51.cc)   ***/
也可以使用php的内置函数strip_tags()清除html,注释等标记

相关文章

文章浏览阅读8.4k次,点赞8次,收藏7次。SourceCodester Onl...
文章浏览阅读3.4k次,点赞46次,收藏51次。本文为大家介绍在...
文章浏览阅读1.1k次。- php是最优秀, 最原生的模板语言, 替代...
文章浏览阅读1.1k次,点赞18次,收藏15次。整理K8s网络相关笔...
文章浏览阅读1.2k次,点赞22次,收藏19次。此网络模型提供了...
文章浏览阅读1.1k次,点赞14次,收藏19次。当我们谈论网络安...