分类: java2015-01-16 00:28 1280人阅读 评论(9) 收藏 举报
 

目录(?)[+]

 

上一篇文章《编程思想之正则表达式 》中讲了正则表达式的原理、使用方法和常见的正则表达式总结,本文将进一步探讨Java正则表达中Greedy、Reluctant、Possessive三种策略的区别。

从Java的官方文档http://docs.oracle.com/javase/7/docs/api/java/util/regex/Pattern.html中我们可以看到,正则表达式表示数量词的符号有三套,分别是Greedy(贪婪的)、Reluctant(勉强的)和Possessive(独占的)。其含意如下:

Greedy 数量词

X?

X,一次或一次也没有

X*

X,零次或多次

X+

X,一次或多次

X{n}

X,恰好 n 次

X{n,}

X,至少 n 次

X{n,m}

X,至少 n 次,但是不超过 m 次

Reluctant 数量词

X??

X,一次或一次也没有

X*?

X,零次或多次

X+?

X,一次或多次

X{n}?

X,恰好 n 次

X{n,}?

X,至少 n 次

X{n,m}?

X,至少 n 次,但是不超过 m 次

Possessive 数量词

X?+

X,一次或一次也没有

X*+

X,零次或多次

X++

X,一次或多次

X{n}+

X,恰好 n 次

X{n,}+

X,至少 n 次

X{n,m}+

X,至少 n 次,但是不超过 m 次

Greedy、Reluctant、Possessive的区别

实例说话

看上面的表格我们发现这三种数量词的含意都相同(如X?、X??、X?+都表示一次或一次也没有),但他们之间还是有一些细微的区别的。我们先来看一个例子:

1.Greedy

  1. public static void testGreedy() {
  2. Pattern p = Pattern.compile(".*foo");
  3. String strText = "xfooxxxxxxfoo";
  4. Matcher m = p.matcher(strText);
  5. while (m.find()) {
  6. System.out.println("matched form " + m.start() + " to " + m.end());
  7. }
  8. }

结果:

matched form 0 to 13

2.Reluctant

  1. public static void testReluctant() {
  2. Pattern p = Pattern.compile(".*?foo");
  3. String strText = "xfooxxxxxxfoo";
  4. Matcher m = p.matcher(strText);
  5. while (m.find()) {
  6. System.out.println("matched form " + m.start() + " to " + m.end());
  7. }
  8. }

结果:

matched form 0 to 4

matched form 4 to 13

3.Possessive

  1. public static void testPossessive() {
  2. Pattern p = Pattern.compile(".*+foo");
  3. String strText = "xfooxxxxxxfoo";
  4. Matcher m = p.matcher(strText);
  5. while (m.find()) {
  6. System.out.println("matched form " + m.start() + " to " + m.end());
  7. }
  8. }

结果:

//未匹配成功

原理讲解

Greedy数量词被称为“贪婪的”是因为匹配器被强制要求第一次尝试匹配时读入整个输入串,如果第一次尝试匹配失败,则从后往前逐个字符地回退并尝试再次匹配,直到匹配成功或没有字符可回退。

模式串:.*foo

查找串:xfooxxxxxxfoo

结果:matched form 0 to 13

其比较过程如下

Reluctant采用与Greedy相反的方法,它从输入串的首(字符)位置开始,在一次尝试匹配查找中只勉强地读一个字符,直到尝试完整个字符串。

模式串:.*foo

查找串:xfooxxxxxxfoo

结果:matched form 0 to 4

matched form 4 to 13

其比较过程如下

Possessive数量词总是读入整个输入串,尝试一次(仅且一次)匹配成功,不像Greedy,Possessive从不回退,即便这样做也可能使整体匹配成功。

模式串:.*foo

查找串:xfooxxxxxxfoo

结果:

//未匹配成功

其比较过程如下

参考文章:http://docs.oracle.com/javase/tutorial/essential/regex/quant.html

再来看看几个例子:

模式串:.+[0-9]

查找串:abcd5aabb6

结果:matched form 0 to 10

模式串:.+?[0-9]

查找串:abcd5aabb6

结果:matched form 0 to 4

模式串:.{1,9}+[0-9]

查找串:abcd5aabb6

结果:matched form 0 to 10

模式串:.{1,10}+[0-9]

查找串:abcd5aabb6

结果:匹配失败

如果您有什么疑惑和想法,请在评论处给予反馈,您的反馈就是最好的测评师!由于本人技术和能力有限,如果本博文有错误或不足之处,敬请谅解并给出您宝贵的建议!

========================欢迎关注编程思想系列文章========================

编程思想之正则表达式

编程思想之迭代器

编程思想之递归

编程思想之回调

最新文章

  1. Linux系统修改PATH环境变量方法
  2. java中的单例模式(懒汉式+饿汉式)
  3. Vanilla Masker – 功能强大的输入过滤插件
  4. springmvc注解配置
  5. golang gc 问题(转的)
  6. SQL Server 得到SPID,唯一的sessionID
  7. Linux中常见问题(磁盘 定时任务)
  8. 【深度学习系列】用PaddlePaddle和Tensorflow实现经典CNN网络Vgg
  9. jquery绑定onkeyup()事件3中方法
  10. 简单工厂模式demo
  11. ANG通证是什么?有关ANG通证的干货都在这里
  12. jQuery方法区别:click() bind() live() delegate()区别
  13. MSChart的研究(转)
  14. Niagara物联网框架机制一(笔记)
  15. web服务器集群(多台web服务器)后session如何同步和共享
  16. day14 Python集合关系运算交,差,并集
  17. Ionic下的JPush缺少统计代码问题解决方法
  18. day23-类的封装
  19. Spring目前用到的知识点
  20. Chapter4(表达式) --C++Prime笔记

热门文章

  1. 48、ViewFlow ---- 滑动广告页
  2. android实现卸载提示
  3. js 自学,云知梦知识 点理论
  4. Java基础 - 获取键盘输入
  5. Django 模板系统(template)
  6. http请求设置setConnectTimeout()方法超时无响应
  7. Ubuntu 14.04上安装WineTMQQ2013麒麟版
  8. Way to Git
  9. 加载顺序 ready onload onreadystatechange
  10. $《第一行代码:Android》读书笔记——第1章 Android系统