【概念】

RegEx

正则表达式是一种特殊的字符序列,可帮助您使用专门的模板语法,来匹配对应的匹配方法或字符串组

它们可用于搜索,编辑或操纵文本和数据

正则表达式通常用于验证输入和检索信息

比如我们要寻找一个"car",那么在下面几种情况都可以利用正则表达式:

1.car 作为独立的一个单词出现

2.car 是某个单词的一部分,比如说carton就是含"car"的单词

3.car 中c,a,r按顺序出现在一个单词里面,比如,chandler

可以认为,RegExV是用广泛使用的正式语言写的,一种简洁的字符串匹配方法

【使用】

使用RegEx的方法主要是使用matches(),比如

boolean bool = "abbbb" . matches("ab8")

如你所见,这个方法会得到一个boolean值

下面演示几种用法,problem代表要检查的语句,可以直接使用string

"problem".matches(RegEx)

  “abc”.matches(“abc”)
“Abc”.matches(“Abc”)
“Abc”.matches(“abc”) //false
“aabbaba”.matches(“[ab]*”)
“aabbaba”.matches(“a[ab]*”)
“bbaba”.matches(“a[ab]*”)//false

【语法】

1.完全相连的字母,比如abc,需要完全匹配(含大小写)

2.用[]括起来的,代表可以用[]里面的其中一个字母代替,同样适用于大小写的替代,比如[Dd]

比如ca[bdn],就可以用cab,cad,can来匹配

3.使用^代表Not,非

比如,ca[^brt],就 不能 用cab,car,cat匹配

此外,^不可以被用于匹配第一个字符

【语法:范围】

[a-z] 任意小写字母

[A-Z] 任意大写字母

[aA-zZ] 任意大小写字母

[0-9] 任意数字

[a-z&&[^xyz]] 从a-z,但是不含x,y,z

[a-zA-Z0-9] 任意大小写字母或数字

【语法:数量】

:代表出现0次/没有出现,或者出现很多次,比如

ab
a ab abb abbbb

[ab]* aa aabbababbaaabbabaabba bbba

+:出现一次或者很多次

ab+ ab abb abbbb

?:代表出现0次或者一次

Colou?r Colour Color (?作用于u)

【语法:“清点”】

x{3} // 只有xxx

x{3,} // 大于等于三次就可以xxx xxxxxxxxxxxx...

x{2,4} // 有两次到四次都可以,xx, xxx and xxxx

.[a-z]{2,4} //代表这从点. 开始,后跟2-4的字母,比如 (.ie .com .info)

【语法:通配】

点, .是通配符,它​​允许字符串中的任何字符(除了换行符也就是回车)

re.d //匹配 read reed rezd

【语法:反斜杠与特殊字符】

使用反斜杠,会让“反斜杠后跟的特殊字符”变成“普通字符”

比如.和\. 后者就是普通字符的意思

"www.4399.com".matches("www\\.[a-zA-z]+||.[a-z]{2,4}")

按理来说,只要.就可以代表普通字符点.了,那么为什么需要两个斜杠呢,见下方的“单词word”部分

•“ab”c” 需要写成 “ab\”c”

•“ab””c” 需要写成 “ab\”\”c”

•“ab\c” 需要写成 “ab\c”

•“ab\c” 需要写成 “ab\\c”

【语法:单词word】

反斜杠\加上字符是一个特殊字符,“单词word”是字母数字字符和下划线的非空序列

“the backslash \character is a special character. It means, do Not treat the following character in the normal way”

“反斜杠\字符是一个特殊字符。它的意思是,不要以正常的方式输入下面的字符”(\.就是这个原因)

“ \\.实际上被转义为两次,\\在java中被转换为一个'\'字符,然后'\.'被传给正则,\.表示对点字符进行转义,使.就表示字符'.',而不使用它在正则中的特殊意义”

就像上面这句话,实质上在预览中只看得到两个斜杠一个点,两个斜杠,一个斜杠,一个斜杠一个点,一个斜杠一个点。这里也利用了类似的办法是反斜杠变成了普通字符

. 句号,停止符号。另外这个规则意味着如果我们想要匹配一个点,需要输入"\."

\b 词语边界

\s 空格

\ 反斜杠与字符

\t 制表字符

\d 数字

\w word字符

【PDF里面的列表图片,24页】

【java.util.regexpackage】

以下内容需要配合java.util.regexpackage使用,也算可以先不看的额外内容

Pattern Class :Pattern对象是正则表达式的编译表示,Pattern类不提供公共构造函数。要创建一个pattern,必须首先调用其公共静态compile()方法之一,然后再返回一个Pattern对象,这些方法接受正则表达式作为第一个参数

Matcher Class : Matcher对象是解释模式并针对输入字符串执行匹配操作的引擎,与Pattern类一样,Matcher也没有定义公共构造函数。您可以通过在Pattern对象上调用matcher()方法来获得Matcher对象

PatternSyntaxException: 指示正则表达式模式中的语法错误的未检查的异常

捕获组Capturing Groups:

捕获组是将多个字符视为一个单元的一种方式。通过将要分组的字符放在一组括号中来创建它们。

例如,正则表达式(dog)创建一个包含字母“ d”,“ o”和“ g”的单个组

捕获组的编号是从左到右计算它们的开括号

((A)(B(C)))有四个组,((A)(B(C))) , (A) ,(B(C)) ,(C)

groupCount():

为了找出表示该表达式中有多少个组,请调用“ groupCount”方法匹配对象。“ GroupCount”方法返回i\一个int,以显示该匹配器模式matcher'spattern中存在的捕获组数

还有一个特殊的组,组0,始终代表整个表达式。该组不包括按组计数报告的总数。

(更多方法和实例详见PDF的27 - 41 页)

(编写这部分内容的时候,对markdown还不够熟练,可能有bug,请指出)

最新文章

  1. 裁剪Tessdata
  2. C#利用反射机制创建对象
  3. ural 1339. Babies
  4. 【BZOJ3531】[Sdoi2014]旅行 树链剖分+动态开点线段树
  5. 【WPF】提高InkAnalyer手写汉字识别的准确率
  6. shell脚本实例-游戏脚本
  7. stardict dict
  8. UVa 11234 Expressions (二叉树重建&由叶往根的层次遍历)
  9. Poj OpenJudge 百练 1860 Currency Exchang
  10. yii [error] [exception.CHttpException.404] exception 'CHttpException' with message 'Unable to resolve the request "favicon.ico".'
  11. JAVA设计模式(09):结构化-代理模式(Proxy)
  12. 格式化一个文件的大小(size),或者说是格式化一个app的大小(size)
  13. Angularjs跳转切换至对应选项卡
  14. 51Nod--1011最大公约数GCD
  15. ORA-16032: parameter LOG_ARCHIVE_DEST_3 destination string cannot be translated问题处理过程
  16. jQuery toastr提示简单实现
  17. myBatis简学
  18. 大数据入门到精通11-spark dataframe 基础操作
  19. postman 的基础使用
  20. 提升HTML5的性能体验系列之二 列表流畅滑动

热门文章

  1. 聊一下PBN程序图例中的XTT
  2. 12_MySQL如何对查询结果进行排序
  3. 不可不知的 JVM 预热
  4. JavaScriptBOM操作
  5. Information:java: javacTask: 源发行版 8 需要目标发行版 1.8
  6. token、cookie和session区别以及django中的cookie,csrf
  7. es6 快速入门 —— 函数
  8. MySQL:多表查询
  9. 基于Hi3559AV100的视频采集(VDEC-VPSS-VO)整体框图设计
  10. Get和Post请求方式