using System.Text.RegularExpressions

///   <summary>
/// 去除HTML标记
/// </summary>
/// <param name="NoHTML">包括HTML的源码 </param>
/// <returns>已经去除后的文字</returns>
public static string NoHTML(string Htmlstring)
{
//删除脚本
Htmlstring = Regex.Replace(Htmlstring,@"<script[^>]*?>.*?</script>","",RegexOptions.IgnoreCase);
//删除HTML
Htmlstring = Regex.Replace(Htmlstring,@"<(.[^>]*)>","",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"([\r\n])[\s]+","",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"-->","",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"<!--.*","",RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring,@"&(quot|#34);","\"",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(amp|#38);","&",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(lt|#60);","<",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(gt|#62);",">",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(nbsp|#160);"," ",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(iexcl|#161);","\xa1",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(cent|#162);","\xa2",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(pound|#163);","\xa3",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring,@"&(copy|#169);","\xa9",RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);","",RegexOptions.IgnoreCase); Htmlstring.Replace("<","");
Htmlstring.Replace(">","");
Htmlstring.Replace("\r\n","");
Htmlstring=HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim(); return Htmlstring;
} 写一个静态方法
#region 移除HTML标签
/// <summary>
/// 移除HTML标签
/// </summary>
/// <param name="HTMLStr">HTMLStr</param>
public static string ParseTags(string HTMLStr)
{
return System.Text.RegularExpressions.Regex.Replace(HTMLStr, "<[^>]*>", "");
} #endregion #region 取出文本中的图片地址
/// <summary>
/// 取出文本中的图片地址
/// </summary>
/// <param name="HTMLStr">HTMLStr</param>
public static string GetImgUrl(string HTMLStr)
{
string str = string.Empty;
string sPattern = @"^<img\s+[^>]*>";
Regex r = new Regex(@"<img\s+[^>]*\s*src\s*=\s*([']?)(?<url>\S+)'?[^>]*>",
RegexOptions.Compiled);
Match m = r.Match(HTMLStr.ToLower());
if (m.Success)
str = m.Result("${url}");
return str;
} #endregion

  

最新文章

  1. iOS开发 传感器(加速计、摇一摇、计步器)
  2. Application.DoEvents():概念
  3. 创建Windows截图工具的快捷方式
  4. paip.重装系统后firefox火狐收藏夹的恢复
  5. iPhone开发视频教程 Objective-C部分 (51课时)
  6. 一个简单的SqlServer游标使用
  7. 关于ES6扩展属性
  8. codeforce 605B. Lazy Student
  9. hdoj 1045 Fire Net
  10. m,mm,mmm的用法
  11. 浅谈Android中Serializable和Parcelable使用区别
  12. 微信扫一扫JSSDK 扫一扫报错 invalid signature 问题
  13. 笔记:MyBatis 其他特性
  14. MySQL 复制 - 性能与扩展性的基石 1:概述及其原理
  15. navicat premium 安装破解(Mac &amp; win)
  16. 一起学libcef--搭建自己的libcef运行环境(Win32程序,错误C2220解决方案)
  17. 手动卸载CAD 删除残留文件 清理遗留的文件
  18. Ckeditor一种很方便的文本编辑器
  19. MVC的多页面后台管理系统
  20. JS - 查找同辈中的对象

热门文章

  1. DateTime.IsLeapYear 方法判断是否是闰年,DaysInMonth判断一个月有几天,Addday取得前一天的日期GetYesterDay
  2. 【开发流程】土耳其CDD工具
  3. ASM中的别名
  4. exists与in的使用与区别
  5. 数字图像处理-----主成成分分析PCA
  6. Ubuntu中、英文环境设置
  7. Ubuntu_wifi&pppoe
  8. RabbitMQ C# 例子 -摘自网络
  9. hibernate 打印sql和参数的配置
  10. 一些常用的IOS开发网站