Linux sed识别HTML标签
在做Linux作业,遇到一题用sed替换掉文件中的特殊字符,其中HTML标签就是一大堆特殊字符。
先来说说sed的替换使用“s/待替换的字符/将替换成的字符/”。
其后还可以跟g,即“s///g”,表示全局替换,整个文本都会执行替换词。
再者,遇到相同字符串中含有大小字母,忽略大小字母进行替换,则使用i,即“s///i” 。
如果遇到需要执行多个sed命令,可以使用-e,同时执行多个命令。如:sed -e "2d" -e "s/ABC/XYZ/i";
现在再来说说重点,如何替换:
1.只想单纯过滤掉html标签,显示内容:
"s/<[^>]*>//g"
2.识别出html标签(这个要换成与html标签对应的字符):
下面的是一些对应字符替换
s/<title>/.TL\n/g
s/</title>//g
s/<author>/.AU\n/g
s/</author>//g
s/<institution>/.AI\n/g
s/</institution>//g
s/<abstraction>/.AB/g
s/</abstraction>/.AE/g
s/<i>/.I /g
s/</i>/\n/g
s/<h1>/.NH\n/g
s/</h1>//g
s/<p>/.PP/g
s/</p>//g
s/<foot>/.FS/g
s/</foot>/.FE/g
s/<li>/.IP/g
s/</li>//g
s/<quote>/.QP/g
s/</quote>//g
s/<table>/.TS/g
s/</table>/.TE/g
s/<equation>/.EQ/g
s/</equation>/.EN/g
s/<picture>/.PS/g
s/</picture>/.PE/g
s/<pre>/.DS/g
s/</pre>/.DE/g
最新文章
- vue组件编译原理
- 007-Scala类的属性和对象私有字段实战详解
- android QQ消息左滑动删除实例(优化版SwipeListViewEX)
- sqlserver下载
- mssql手工注入
- passing ‘const ’ as ‘this’ argument of ‘’ discards qualifiers 错误处理
- HDU3732 背包DP
- 对hashmap与hashcode()、equals()的理解
- Windows Phone Emoji
- .NET混淆工具 (Dotfuscator Professional Edition)
- m版页面判断安卓与ios系统
- java之重定向与转发
- Ext表格分页
- 1.Cocos2d-x-3.2编写3d打飞机,粒子管理器代码
- MongoDB在Linux系统下的安装与启动
- Java并发编程75道面试题及答案
- OpenCV编译以及QT Creator配置
- Eclipse 项目导航字体设置 左侧树字体
- NPOI操作Excel(二)--创建Excel并设置样式
- 最优-scroll事件的监听实现