public static string Html2Text(string htmlStr)

{

    if (String.IsNullOrEmpty(htmlStr))

    {

        return "";

    }

    string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //定义style的正则表达式 

    string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; //定义script的正则表达式   

    string regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式   

    htmlStr = Regex.Replace(htmlStr, regEx_style, "");//删除css

    htmlStr = Regex.Replace(htmlStr, regEx_script, "");//删除js

    htmlStr = Regex.Replace(htmlStr, regEx_html, "");//删除html标记

    htmlStr = Regex.Replace(htmlStr, "\\s*|\t|\r|\n", "");//去除tab、空格、空行

    htmlStr = htmlStr.Replace(" ", "");

    htmlStr = htmlStr.Replace(""", "");//去除异常的引号" " "

    htmlStr = htmlStr.Replace(""", "");

    return htmlStr.Trim();

}

Html2Text

转载地址:http://www.cnblogs.com/ben121011/p/5778880.html?utm_source=tuicool&utm_medium=referral

最新文章

  1. 第二章 NIO入门
  2. 对于C(n,k)取模
  3. 再说virtual
  4. 源码安装rsyslog
  5. ReactiveCocoa学习笔记--用法
  6. 绕过js验证
  7. java中抽象类的定义和使用
  8. Python调用ansible API系列(四)动态生成hosts文件
  9. 小米众筹新品---8H凉感慢回弹记忆绵枕 99元 上手开箱图
  10. js常会问的问题:找出字符串中出现次数最多的字符。
  11. Process和ProcessBuilder入门【原】
  12. vue-fetch
  13. 如何在Linux中使用Firejail运行应用程序
  14. NCBI News
  15. 16位CRC校验_Delphi
  16. error: In function ‘void* opencv_showimg(void*)’:
  17. vue制作小程序--server
  18. Spring线程池ThreadPoolTaskExecutor配置及详情
  19. oracle的乐观锁和悲观锁
  20. &amp;lt;LeetCode OJ&amp;gt; 78 / 90 Subsets (I / II)

热门文章

  1. 创建Server(tomcat)时候报Cannot create a server using the selected type
  2. iOS 热更新方案 - lance的专栏 - 博客频道 - CSDN.NET
  3. [置顶] 解决Firefox/Opera 不支持 onselectstart事件
  4. QMsgPack的用法DEMO
  5. bionase
  6. Android 4.0 x86安装教程 附带联网参数详细设置
  7. C#常见算法题目
  8. django ORM创建数据库方法
  9. 直播 背景 技术体系 乐视云直播Demo
  10. 修改elementUI组件样式无效的问题研究