python 正则表达提取方法 (提取不来的信息print不出来 加个输出type 再print信息即可)
2024-10-18 20:19:44
1,正则表达提取 (findall函数提取)
import re
a= "<div class='content'>你大爷</div>"
x=re.findall("<div class='content'>(.*)</div>",a)
这样也可以:
x=re.findall(" class='content'>(.*)</d",a) 其中" class='content'>(.*)</d" 是匹配左边为class='content'> 右边为</d ,取其中的字符
print x[0]
有时候发现输出list的字符时会展示不出:
加上print typ(x),就可以了
取中间的数字方法:
第二种方法:python类似正则表达式的函数
Url:http://www.jb51.net/article/54281.htm
startswith()函数
此函数判断一个文本是否以某个或几个字符开始,结果以True或者False返回。
text='welcome to qttc blog'
print text.startswith('w') # True
endswith()函数
此函数判断一个文本是否以某个或几个字符结束,结果以True或者False返回。
判断文件是否为exe执行文件
我们可以利用endswith()函数判断文件名的是不是以.exe后缀结尾判断是否为可执行文件
最新文章
- 9.1.3 .net framework通过业务逻辑层自动生成WebApi的做法
- 并联机构逆运动学用MapleSim符号来解决
- SQL Server 2014 SP2发布下载:数十项更新修复
- hive的Query和Insert,Group by,Aggregations(聚合)操作
- Spark源码系列(四)图解作业生命周期
- Using unique option prefix myisam-recover instead of myisam-recover-option
- Working with BeforeProperties and AfterProperties on SPItemEventReceiver
- Android调用MediaScanner进行新产生的媒体文件扫描
- [AngularJS + Webpack] Requiring Templates
- ssh key报but this does not map back to the address – POSSIBLE BREAK-IN ATTEMPT!错误
- Python 保存爬行动物捕捉网页
- HDU 5366 The mook jong
- 使用PLSQL Developer连接Oracle Database 11g Express Edition
- 为什么python适合写爬虫?(python到底有啥好的?!)
- 通过COM组件方式实现java调用C#写的DLL文件
- 【webpack学习笔记】a06-生产环境和开发环境配置
- Zabbix安装部署(CentOS系统下)
- 修改VS 中的代码编辑颜色-Vs主题修改
- 20144306《网络对抗》Web基础
- Time range (447392) for take &#39;Take 001&#39; is larger than maximum allowed(100000).