1.[]表达式的用法

正则表达式可以让我们匹配我们想要的字符串形式,增加了效率,在自然语言处理领域有较大的作用。

模式 匹配
[Ww]oodchuck Woodchuck,woodchuck
[1234567890] Any digit

如上面所用的模式既是正则表达式中的常用语法,在“[]”内部的字母表示可以匹配其中的任一字母,

[A-Z]表示大写字母,[a-z]表示小写字母,[0-9]表示数字,[A-Za-z]表示大写加小写字母,

2.特别字符的用法

模式  含义 匹配
colou?r 匹配前面表达式0次或1次 color,colour
oo*h! 匹配前面表达式0至无穷次 oh!,ooh!,oooh!
o+h! 匹配前面表达式1至无穷次 oh!,ooh!,oooh!
beg.n 匹配任意字母 begin,beghn
a|b|c a/b/c a,b,c

在正则表达式中还有两个表示位置的符号,分别是"^"和"$",代表开头和结尾。

^[A-Z]匹配首字母大写的字符串,如

.$则表示匹配字符串的最后一个任意字母,演示如下

3.示例

下面是一个我们要匹配出所有的the的过程。

当我们直接用the进行匹配时发现出现了两个错误,一个是没有把大写的The匹配进来(准确率),还有一个是把there中的前三个字母误当成了the(召回率)。

对正则表达式进行修改

这样成功的把所有的the匹配出来了,但是召回率依旧没有提高,继续修改

[^A-Za-z]表示匹配不属于这个合集的字符。

最新文章

  1. Vertica 分区表设计
  2. js 递归学习
  3. 关于winform中*.exe.config中的appSettings的节点的读取与修改
  4. 错误:document.getElementById("userForm").submit();Object is not a function
  5. qsort函数详解
  6. Unity摄像机的正交视图与透视图
  7. uboot完全手册---14
  8. android 反编译 逆向工具整理
  9. 【原】K3Cloud平台开发之Python插件
  10. lua实现多继承
  11. Game
  12. 【二十七】php之绘图技术(gd、jpgraph、短信随机验证码)
  13. ant安装和验证
  14. POJ 2185 Milking Grid [KMP]
  15. Linux中SVN的备份与恢复
  16. Python format 格式化函数
  17. SpriteBuilder中使用TrueType字体的一些障碍
  18. webservice接口和http接口介绍---更新版
  19. js文字从左边飞入效果
  20. 读取Excel表格中数据原型

热门文章

  1. JAVA踩坑录
  2. HTM概述
  3. Goland 激活码
  4. 一条语句kill 多条mysql语句
  5. echarts之title-textAlign
  6. BP神经网络算法预测销量高低
  7. 图像欧拉数计算 matlab实现
  8. 什么是梯度下降法与delta法则?
  9. 冲刺Noip2017模拟赛7 解题报告——五十岚芒果酱
  10. DataNode 详解及HDFS 2.X新特性