一、正则表达式简介

正则表达式的官方文档:https://www.runoob.com/regexp/regexp-tutorial.html

正则表达式:又称正规表示式、正规表示法、正规表达式、规则表示式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或者是RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列某个句法规则的字符串。在很多文本编辑器里,正则表达式通常来检索、替换那些匹配某个模式的文本。

  按某种规则匹配的表达式。

二、正则介绍

  正则表达式是一个工具,用于匹配字符串,或用来提取字符串。

1、判断一个字符串是否匹配给定的格式(判断用户账号是否满足格式)

2、从字符串中,按指定格式提取信息(抓取手机号)

import re
str1 = 'fijiooe18814726275iufdrrrrdf18814726275fsdssa'
# 定义一个查找的规则
# 已知需要查找的手机号
p = ''
# search(): 从前往后查找数据,默认返回找到的第一个数据,不会再继续往后面找
res = re.search(p,str1).group()
print(res)

三、元字符

表示单字符

字符 功能
. 匹配任意一个字符(除了\n)
[] 匹配[]中列举的字符
\d 匹配数字,即0-9
\D 匹配非数字,即不是数字
\s 匹配空白,即空格,tab键
\S 匹配非空白
\w 匹配单词字符,即a-z、A-Z、0-9、_
\W 匹配非单词字符

表示数量

匹配多个字符的相关格式。

字符 功能
* 匹配前一个字符出现0次或者无限次,即可有可无
+ 匹配前一个字符出现1次或者无限次,即至少有1次
? 匹配前一个字符出现1次或者0次,即要么有1次,要么没有
{m} 匹配前一个字符出现m次
{m,} 匹配前一个字符至少出现m次
{m,n} 匹配前一个字符至少出现m~n次

表示边界

字符 功能
^ 匹配字符串开头
$ 匹配字符串结尾
\b 匹配一个单词的边界
\B 匹配非单词边界

匹配分组

字符 功能
| 匹配左右任意一个表达式
(ab) 将括号中字符作为一个分组
\num 引用分组num匹配到的字符串
(?P<name>) 分组起别名
(?P=name) 引用别名为name分组匹配到的字符串

四、re模块

  • re.match函数

  re.match函数尝试从字符串的起始位置匹配一个模式,匹配成功,返回的是一个匹配对象(这个对象包含了匹配的信息,如果不是起始位置匹配成功的话,match()就会返回None。)

  • re.search方法

  re.search()扫描整个字符串并返回第一个成功匹配到的字符。

  • re.match与re.search的区别

  re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回为None;而re.search匹配整个字符串,直到找到一个匹配

  • findall方法

  在字符串中找到正则表达式所匹配的所有子串,并以列表的形式进行返回,如果没有找到匹配的。则返回来一个空列表。

  • 注意:match和search 是匹配一次;而findall是匹配所有。

  • sub方法

  替换字符串中的某些字符,可以用正则表达式来匹配被选子串。

  re.sub(pattern,repl,string,count=0)

    • pattern :表示正则表达式中的模式子串;
    • repl:被替换的字符串(既可以是字符串,也可以是函数)
    • string:要被处理的字符串,要替换的字符串
    • count:替换的次数
str4 = '1#python#232th32#python#uedue#python#oyfdsthdsaastrtn'
# ()将括号中的字符作为一个分组
p17 = 'py(th)on'
res1 = re.search(p16,str4)
print(res1) res2 = re.search(p16,str4).group(1)
print(res2) # 匹配一个任意字符,出现一次以上且关闭贪婪模式
p18 = '#.+?#'
res3 = re.findall(p18,str4)
print(res3) p19 = '#(.+?)#'
res4 = re.findall(p19,str4)
print(res4) # 替换str4字符串中的p19为'*java*'字符串,count来控制替换的次数
res5 = re.sub(p19,'*java*',str4)
print(res5)

五、贪婪模式

  python中数量词默认是贪婪模式,总是尝试匹配尽可能多的字符;非贪婪模式相反,总是尝试匹配尽可能少的字符。

  在 *、?、+、{m,}、{m,n}后面加上?,可以使贪婪模式变成非贪婪模式。

练习

import re
str1 = 't fijiooe18 71%^&&@#@47262 75i_ufdrrrrdf1 _8814726 275fsd ssa' # 定义一个查找的规则
# 已知需要查找的手机号
p1 = ''
# 匹配11位数字的手机号码
p2 = '\d{11}'
# 匹配手机号码
p3 = '1[3-9]\d{9}'
# 匹配非数字
p4 = '\D{2}'
# 匹配空格
p5 = '\s'
# 匹配非空格
p6 = '\S'
# 匹配单次字符,即A-Z、a-z、0-9、_
p7 = '\w'
# 匹配非单次字符,即除A-Z、a-z、0-9、_以外的字符
p8 = '\W'
# 匹配任意字符
p9 = '.' # search(): 从前往后查找数据,默认返回找到的第一个数据,不会再继续往后面找
res = re.search(p1,str1)
print(res) # findall() :找出所有符合规范的字符,以列表形式返回。
res = re.findall(p1,str1)
print(res) # 正则表达式:默认是贪婪模式,贪婪模式是尽可能取最多的值。
p10 = '\d{3,5}'
# 关闭贪婪模式:用? 尽可能取最少的值
p11 = '\d{3,5}?' # 注意:匹配规则中涉及到数量范围的时候,会出现贪婪模式。如 {m,} {m,n} * + # 表示边界的
str2 = '1python23232 python uedu python oy fdsd saas python'
# ^ 表示匹配字符串开头
p12 = '^py'
res1 = re.search(p12,str2)
res2 = re.findall(p12,str2)
print(res1,res2) # $ 表示字符串结尾
p13 = 'python$'
res1 = re.search(p13,str2)
res2 = re.findall(p13,str2)
print(res1,res2) # \b 匹配单词边界
p14 = r'\bpy'
res1 = re.search(p14,str2)
res2 = re.findall(p14,str2)
print(res1,res2) # \B 匹配非单词边界
p15 = '\Bpy'
res1 = re.search(p15,str2)
res2 = re.findall(p15,str2)
print(res1,res2) # 匹配分组
str3 = '1python232th32 python uedu eepython oy fdsthd saas trtython'
# ()将括号中的字符作为一个分组
p16 = 'py(th)on'
res1 = re.search(p16,str3)
res2 = re.findall(p16,str3)
print(res1,res2)

六、封装一个自己的正则表达式的类

封装的需求:替换测试用例中的参数

           简化参数替换的流程

封装的思路:1、获取测试用例数据

      2、判断该条测试用例数据是否有需要替换的参数

      3、调用封装好的正则表达式类进行参数替换

import re
from common.config import conf
def replace(data):
"""
用来替换测试用例的参数
:param data: 用例的参数
:return:
"""
p = r'#(.+?)#'
# 判断测试用例中的参数是否替换
while re.search(p,data):
# 查找配置文件中需要替换的测试用例参数
key = re.search(p,data).group(1)
value = conf.get('test_data',key)
# 替换测试用例数据参数
data = re.sub(p,value,data,count=1)
return data

最新文章

  1. [转]自己写PHP扩展之创建一个类
  2. virtual memory exhausted: Cannot allocate memory
  3. 微信网页开发之创建Controller(三)
  4. Redis教程(十三):管线详解
  5. 从头开始 启动开源电商项目jShop
  6. spinner下拉框组件
  7. HDU 5805 NanoApe Loves Sequence (思维题) BestCoder Round #86 1002
  8. Sikulix IDE简介
  9. SQL Server数据库文件存储目录转移
  10. hdu 1885 Key Task (三维bfs)
  11. ZZNU 1163: 在线判题(指针专题)
  12. android 获取日期
  13. memcached性能测试之Twemperf
  14. Android 控件绑定封裝
  15. 从开启GTID功能的库同步数据到未开启GTID功能库时,注意事项!
  16. jQuery实现点赞动态效果
  17. linux suse 3.0.101的一次中断暴增的排查
  18. 虚拟化(三):vsphere套件的安装注意及使用
  19. FT项目开发技术点(二)
  20. Unity3D中的弹道和移动目标提前量计算

热门文章

  1. 七、smarty--缓存的控制
  2. 国际标准 ISO 15008
  3. jqGrid细节备注—jqGrid中自定义格式,URL格式
  4. os x 技巧: 关闭打字时候光标闪烁
  5. SparseLDA算法
  6. 封装jquery插件
  7. swagger生成文档初步使用
  8. WM_RBUTTONUP消息收不到问题
  9. Spring(八)-- 代理设计模式
  10. poj 1061 青蛙的约会+拓展欧几里得+题解