c# 去除文本的html标签
2024-10-10 19:24:56
public static string ContentReplace(string input)
{
input = Regex.Replace(input, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"-->", "", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"<!--.*", "", RegexOptions.IgnoreCase); input = Regex.Replace(input, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"&(amp|#38);", "&", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"&(lt|#60);", "<", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"&(gt|#62);", ">", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase);
input = Regex.Replace(input, @"&#(\d+);", "", RegexOptions.IgnoreCase); input.Replace("<", "");
input.Replace(">", "");
input.Replace("\r\n", "");
//去两端空格,中间多余空格
input = Regex.Replace(input.Trim(), "\\s+", " ");
return input;
}
最新文章
- yii2分页扩展之实现跳转到具体某页
- android中BuildConfig.DEBUG的使用
- sql server 常用脚本(日常查询所需)
- 布朗语料库中条件概率分布函数ConditionalFreqDist使用
- Spring框架简介 Spring Framework Introduction
- [转载] - QWidget、QMainWindow、QDialog和QFrame的区别
- 解决JS文件页面加载时的阻塞
- Cookie中图片的浏览记录与cookie读取servle时路径的设置(文字描述)
- 指针和const
- tmod命令
- 项目构建之maven篇:2.HelloWorld项目构建过程
- TRIZ系列-创新原理-28-替代机械系统原理
- windows下exfat无法写入修复
- 曲演杂坛--一条DELETE引发的思考
- python中strip函数的用法
- Spring MVC NoClassDefFoundError 问题的解决方法。
- [LeetCode] Construct the Rectangle 构建矩形
- Android中代码运行指定的Apk
- EntityFramework Core指定更新导航属性了解一下?
- 看到Console.WriteLine($";string";)写法,一时间不理解$的用途