利用正则表达式除去html得到纯文本

public static string DelHTML(string Htmlstring)//将HTML去除

{
#region
//删除脚本

Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<script[^>]*?>.*?</script>","",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

//删除HTML

stem.Text.RegularExpressions.RegexOptions.IgnoreCase);

//Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<A>.*</A>","");

//Htmlstring =System.Text.RegularExpressions. Regex.Replace(Htmlstring,@"<[a-zA-Z]*=\.[a-zA-Z]*\?[a-zA-Z]+=\d&\w=%[a-zA-Z]*|[A-Z0-9]","");

Htmlstring = System.Text.RegularExpressions.Regex.Replace(Htmlstring,@"&(cent|#162);","\xa2",@"&(pound|#163);","\xa3",@"&(copy|#169);","\xa9",@"&#(\d+);",51); font-family:Arial; font-size:14px; line-height:26px">
Htmlstring.Replace("<",51); font-family:Arial; font-size:14px; line-height:26px"> Htmlstring.Replace(">",51); font-family:Arial; font-size:14px; line-height:26px"> Htmlstring.Replace("\r\n",51); font-family:Arial; font-size:14px; line-height:26px"> //Htmlstring=HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();
#endregion


return Htmlstring;

}

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...