python15正则表达式

------------恢复内容开始------------

python实现实现实现实现

import re

#将表达式编译,返回一个对象，

pattern = re.compile(r"hello",re.I)#re.I忽略大小写

print(dir(pattern))

#使用对象的方法，通过match匹配

rest = pattern.match("hellossss")

print(rest)

rest1 = pattern.match("Hellossss")

print(rest1)

print(dir(rest1))

结果：

['__class__', '__copy__', '__deepcopy__', '__delattr__', '__dir__', '__doc__', '__eq__', 

'__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__',
 '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', 

'__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 

'findall', 'finditer', 'flags', 'fullmatch', 'groupindex', 'groups', 'match', 'pattern', 

'scanner', 'search', 'split', 'sub', 'subn']

<re.Match object; span=(0, 5), match='hello'>

<re.Match object; span=(0, 5), match='Hello'>

['__class__', '__copy__', '__deepcopy__', '__delattr__', '__dir__', '__doc__', 

'__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', 

'__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', 

'__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__',
 'end', 'endpos', 'expand', 'group', 'groupdict', 'groups', 'lastgroup', 'lastindex', 

'pos', 're', 'regs', 'span', 'start', 'string']

浏览全部字符串，匹配所有合规则的字符串，匹配到的字符串放到一个列表中，未匹配成功返回空列表

一旦匹配成，再次匹配，是从前一次匹配成功的，后面一位开始的，也可以理解为匹配成功的字符串，不在参与下次匹配

无分组：匹配所有合规则的字符串，匹配到的字符串放到一个列表中

有分组：只将匹配到的字符串里，组的部分放到列表里返回，相当于groups()方法

多个分组：只将匹配到的字符串里，组的部分放到一个元组中，最后将所有元组放到一个列表里返

相当于在group()结果里再将组的部分，分别，拿出来放入一个元组，最后将所有元组放入一个列表返回

分组中有分组：只将匹配到的字符串里，组的部分放到一个元组中，先将包含有组的组，看作一个整体也就是一个组，把这个整体组放入一个元组里，然后在把组里的组放入一个元组，最后将所有组放入一个列表返回

import re

#使用编译

coent = "Oone1twoT2three3"

p = re.compile(r"[a-z]+",re.I)#r表示其后的字符串按原样表示，不使用转义字符

rest = p.findall(coent) #一列表的额形式返回

print(rest)

#不编译直接使用方法

print(re.findall(r"[a-z]+",coent,re.I))

结果：

['Oone', 'twoT', 'three']

['Oone', 'twoT', 'three']

import re

content = "quan zhiqiang"

p = re.compile(r"zhi")

rest = p.search(content)

print(rest)

print("QQQQQQQQQQQQQQQQ")

rest1 = p.match(content)

print(rest1)

#因为match从第一个字符开始寻找，第一个字符不匹配直接不寻找了，

#search会继续下一个查找

print("不编译，不编译")

no_rest = re.search("zhi",content)

print(no_rest)

结果：

<re.Match object; span=(5, 8), match='zhi'>

QQQQQQQQQQQQQQQQ

None

不编译，不编译

<re.Match object; span=(5, 8), match='zhi'>

import re

def test_g():

    content = "quanzhiqiang"

    p = re.compile(r"zhi")

    rest = p.search(content)

    print(rest)#注意，当匹配不到的时候，需要对if rest 进行判断，不然直接

    if rest:

        #使用group打印会出错

        print(rest.group())

        #如果前面使用分株，可以group(1)

        print(rest.groups())#因为没有进行分组，所以为空的元组

def test_id():

    p = re.compile(r"(\d{6})(\d{4})((\d{2})(\d{2}))\d{2}\d{1}([0-9]|X)")

    id1 = "440882199904142235"

    id2 = "44088219990214228X"

    rest1 = p.search(id2)

    print(rest1.group(1))

    print(rest1.groups())#放回说有的组

    print("#######################")

    print(rest1.groupdict())

if __name__ == "__main__":

    test_g()

    test_id()

结果：

<re.Match object; span=(4, 7), match='zhi'>

zhi

()

440882

('440882', '1999', '0214', '02', '14', 'X')

#######################

{}

import re

def test_g():

    content = "quanzhiqiang"

    p = re.compile(r"zhi")

    rest = p.search(content)

    print(rest)#注意，当匹配不到的时候，需要对if rest 进行判断，不然直接

    if rest:

        #使用group打印会出错

        print(rest.group())

        #如果前面使用分株，可以group(1)

        print(rest.groups())#因为没有进行分组，所以为空的元组

def test_id():

    #p = re.compile(r"(\d{6})(\d{4})((\d{2})(\d{2}))\d{2}\d{1}([0-9]|X)")

    p = re.compile(r"(\d{6})(?P<year>\d{4})((?P<month>\d{2})(?P<day>\d{2}))\d{2}\d{1}([0-9]|X)")

    id1 = "440882199904142235"

    id2 = "44088219990214228X"

    rest1 = p.search(id2)

    print(rest1.group(1))

    print(rest1.groups())#放回说有的组

    print("#######################")

    print(rest1.groupdict())

if __name__ == "__main__":

    test_g()

    test_id()

结果；

<re.Match object; span=(4, 7), match='zhi'>

zhi

()

440882

('440882', '1999', '0214', '02', '14', 'X')

#######################

{'year': '1999', 'month': '02', 'day': '14'}

import re

s = "one1two2three333four"

p = re.compile(r"\d+")

rest = p.split(s)

print(rest)

结果：

['one', 'two', 'three', 'four']

import re

s = "one1two2three333four"

p = re.compile(r"\d+")

rest = p.split(s,2)#只分割前两个

print(rest)

结果：

['one', 'two', 'three333four']

import re

s = "one1two2three333four"

#s = "one@two@three@four"

p = re.compile(r"\d+")

rest = p.sub("@",s)

print(rest)

#原始的替换方法：

print("@@@@@@@@@@@@@@@@@@@@@@@@@@@")

rest1 = s.replace("1","@").replace("2","@").replace("333","@")

print(rest1)

#更换位置

s2 = "hello world"

p2 = re.compile(r"(\w+) (\w+)")

rest3 = p2.sub(r"\2 \1",s2)

print(rest3)

#使用函数进行替换更换并大写：

def f(m):

    return m.group(2).upper() + " " + m.group(1)

print("HHHHHHHHHHHHHHHHHHHHHHH")

rest4 = p2.sub(f,s2)

print(rest4)

#使用匿名函数替换

print("QQQQQQQQQQQQQQQQQQQQQQ")

rest6 = p2.sub(lambda m :m.group(2).upper() + " " + m.group(1),s2)

print(rest6)

结果：

one@two@three@four

@@@@@@@@@@@@@@@@@@@@@@@@@@@

one@two@three@four

world hello

HHHHHHHHHHHHHHHHHHHHHHH

WORLD hello

QQQQQQQQQQQQQQQQQQQQQQ

WORLD hello

------------恢复内容结束------------

巴特西

python15正则表达式

最新文章

热门文章