问题

首先看一个问题:

import re
text = r"\学"
print(text)
zz = r"\学"
result = re.findall(zz,text)
print(result)

输出:

\学
['学']

为什么没有匹配到反斜杠?

分析

转义:

首先要理解一个概念,python中内置的语法字符窜中有一些特殊的符号,那就是\,被成为转义字符。其中\ 可以与很多字符结合形成一些特殊符号,例如 \n 表示回车。

原始字符串:

print(r"\n")
print("\n")

输出:

\n

在字符串前面加r 即可将字符串解析为原始字符串,即所见即所得,\ 不再具有特殊含义。

回到之前的问题

import re
text = r"\学"
print(text)
zz = r"\学"
result = re.findall(zz,text)
print(result)

为什么匹配不到\,明明都是原始字符串,这里要就是正则的问题了

符号 意义
\w 匹配字母数字及下划线
\W 匹配非字母数字及下划线
\s 匹配任意空白字符,等价于 [ \t\n\r\f]。
\S 匹配任意非空字符
\d 匹配任意数字,等价于 [0-9].
\D 匹配任意非数字
\A 匹配字符串开始

因为 在正则中 \ 也是特殊符号。
所以要真正的匹配\ 这个字符,正则匹配应该这样写r"\\",带入题目中就是zz = r"\\学"
而如果不使用原始字符串应该这样写:

import re
text = r"\学"
print(text)
zz = "\\\\学"
result = re.findall(zz,text)
print(result)

输出:

\学
['\\学']ve

已经匹配出来了,简单解释一下"\\\\学" 首先根据python内置的字符串解析,解析成实际的字符串表示的就是\\学(也就是原始字符串),再由于正则语法解析就能解析出真正要匹配的字符串是\学
其实导致二次转义的这个问题的原因:
\ 在python中字符串中是特殊符号,并且在正则中也是特殊符号,所以才需要转义两次

其他的问题

通过上面这个问题可以看到匹配出的内容是 \\学' ,也就是匹配出显示的内容不是以原始字符串的形式显示的,而print()输出的内容是字符都是转义后的(转义字符生效),例如print('\n')输出的是真的换行 而不是 \n,而正则匹配出的内容更像是代码格式的字符串。

最新文章

  1. Java中Object类
  2. RDIFramework.NET — 基于.NET的快速信息化系统开发框架 - 5.3 数据库连接管理模块
  3. c# 高效的线程安全队列ConcurrentQueue(下) Segment类
  4. xml--通过DOM解析XML
  5. OSG坐标系统
  6. express文件上传
  7. (大数据工程师学习路径)第一步 Linux 基础入门----基本概念及操作
  8. [Usaco2008 Nov]Buying Hay 购买干草[背包]
  9. Linux学习之要点必备
  10. 解析查询 queryString 请求参数的函数
  11. jupyter notebooks 中键盘快捷键
  12. html5 浏览文件
  13. wstngfw openVpn站点到站点连接示例(共享密钥)
  14. extern字符串常量,宏定义字符串常量,怎么选
  15. scala函数式编程(一)
  16. 余玄相似度,TF-IDF
  17. windows 下查看端口占用情况
  18. AI_ 视频监控-人体移动捕捉监测
  19. Java线程wait和sleep的区别
  20. 通过shell定时备份数据库

热门文章

  1. C#/VB.NET 在Word文档中插入分页符
  2. [深度学习]-Dataset数据集加载
  3. Logstash集成GaussDB(高斯DB)数据到Elasticsearch
  4. linux软链接的创建、修改和删除
  5. 【前端必会】webpack的目标代码
  6. Ant Design槽位失效
  7. C#-9 委托
  8. cmd常用命令介绍
  9. sql语法巧用之not取反
  10. Pipeline流水线设计的最佳实践