【Python3 爬虫】09_正则表达式(re.math()、re.search()、re.sub()、全局匹配函数)
2024-08-21 17:20:49
re.math()函数
从源字符串的起始位置匹配一个模式
语法:re.match(pattern, string, flag)
第一个参数代表对应的正则表达式,第二个参数代表对应的源字符,第三个参数是可选参数,代表对应的标志位,可以放模式修正符等信息
#-*- codingn:utf-8 -*-
import re
string = "ipythonajsoasaoso"
pattern = ".python."
result = re.match(pattern, string)
result1 = re.match(pattern, string).span()
print("结果1:%s" % result) print(result1) # (0,8)
re.search()函数
扫描整个字符串进行匹配
语法:re.search(pattern, string, flag)
#-*- codingn:utf-8 -*-
import re
string = "helloipythonajsoasaoso"
pattern = ".python."
result1 = re.match(pattern, string)
result2 = re.search(pattern, string)
print("结果1:%s" % result1)
print("结果2:%s" % result2)
全局匹配函数
将符合模式的全部内容都匹配出来
(1)使用re.compile()对正则表达式进行预编译
(2)编译后使用findall()根据正则表达式从原字符串中将匹配的解决全部找出
#-*- codingn:utf-8 -*-
import re
string = "helloipythonajsoasaospythono"
pattern = re.compile(".python.") #预编译
result = pattern.findall(string) #找出符合模式的所有结果
print("结果1:%s" % result)
re.sub()函数
根据正则表达式来实现替换某些字符串
re.sub(pattern, rep, string, max)
第一个参数对应的正则表达式,第二个参数为要替换成的字符串,第三个参数为源字符串,第四个参数为可选项,代表最多替换的次数,如果忽略不写,则会将符合模式的结果全部替换。
#-*- codingn:utf-8 -*-
import re
string = "bnsdBBjsdkBBlsBBdkBBs"
pattern = "BB"
result1 = re.sub(pattern,"**",string) #全部替换
result2 = re.sub(pattern,"**",string,1) #最多替换1次
result3 = re.sub(pattern,"**",string,2) #最多替换2次 print("结果1:%s" % result1)
print("结果2:%s" % result2)
print("结果3:%s" % result3)
最新文章
- java的执行与加载的过程
- CentOS7+hadoop2.6.4+spark-1.6.1
- NPOI2.0
- cmd下运行java文件时,找不到或无法加载主类的解决方法
- bzoj 3572: [Hnoi2014]世界树 虚树 &;&; AC500
- NOI十连测 第六测 T3
- 【Swift】沙盒缓存
- (原创)Python 自动化测试框架详解
- 复杂JSON反序列化为类对象
- zookeeper leader选举算法源码
- Android为TV端助力:intent传递消息
- php 自制简单路由类 望大神指点
- 【慕课网实战】二、以慕课网日志分析为例 进入大数据 Spark SQL 的世界
- autoware
- Java8-dateTimeFormatter
- ambari安装 QA
- UVa 11107 生命的形式(不小于k个字符串中的最长子串)
- P2704 [NOI2001]炮兵阵地
- Delphi下让窗口不显示在任务栏的另类方法
- 重新拾取的jquery
热门文章
- 怎么在32位windows系统上搭建爬虫框架scrapy?
- CURL命令的使用
- 【转】进程、线程、 GIL全局解释器锁知识点整理
- Python出现";Non-ASCII character '\xe6' in file";错误解决方法
- HDU 2523 sort (hash)
- Codeforces 180C. Letter
- 使用scrapy爬取金庸小说目录和章节url
- Codeforces #430 Div2 D
- 并查集&;线段树&;树状数组&;排序二叉树
- Coloring Dominoes