对于web来说,字符串的处理特别重要,而正则表达式是对字符串处理的利器,在字符过滤,验证方面都能看到她的身影。

今天需要处理一段json字符串,在用String.replaceAll的过程中,遇到了正则表达式不会写的尴尬场景。所以还是简单地补补正则表达式的知识吧。

先从一个正则表达式的使用讲起。

import java.util.regex.Matcher;
import java.util.regex.Pattern; public class Test {
public static void main(String[] args) { //这个正则表达式表示匹配1254-8888888,125-6966356这样子的字符
String regex = "\\d{3,4}-\\d{7}"; //初始字符串
String str = "agdf/1254-8888888sssdf125-6966356";
String aft = str.replaceAll(regex, "替换");
System.out.println("repalceAll后==="+aft); Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(str);
//m.find()为true则一直匹配下去
while(m.find()){
//因为正则表达式中没有()括号,所以捕获组数为0
System.out.println("捕获组数,m.groupCount==="+m.groupCount()); //m.group()相当于m.group(0),对应着groupCount,即直接匹配,不分组
System.out.println("m.group==="+m.group(0)); } } }

运行结果

repalceAll后===agdf/替换sssdf替换
m.group===1254-8888888
捕获组数,m.groupCount===0
m.group===125-6966356
捕获组数,m.groupCount===0

从那个正则表达式说起, String regex = "\\d{3,4}-\\d{7}";

"\\d"这个是java的转义,本来的正则应该是“\d”,表示的是匹配0到9的数字,应该也可以写成这样[0-9],没试过。

"\\d{3,4}"表示\d的个数有3到4个,即匹配123,3212,000这些数字,后面的“\\d{7}”同理,匹配8888888等字符。

至于分组这些,看下下面这个demo

import java.util.regex.Matcher;
import java.util.regex.Pattern; public class Test {
public static void main(String[] args) { //这个正则表达式表示匹配1254-8888888,125-6966356这样子的字符
String regex = "([a-zA-Z]+)(\\d{7})"; //初始字符串
String str = "AGdf12548888888sssdf1256966356"; Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(str);
//m.find()为true则一直匹配下去
while(m.find()){
//因为正则表达式中没有()括号,所以捕获组数为0
System.out.println("捕获组数,m.groupCount==="+m.groupCount()); //m.group()相当于m.group(0),对应着groupCount,即直接匹配,不分组
System.out.println("m.group(0)==="+m.group(0));
//对应第一个括号([a-zA-Z]+)
System.out.println("m.group(1)==="+m.group(1));
//对应第二个括号(\\d{7})
System.out.println("m.group(2)==="+m.group(2)); System.out.println("=============我是换行符============"); } } }

运行结果

捕获组数,m.groupCount===2
m.group(0)===AGdf1254888
m.group(1)===AGdf
m.group(2)===1254888
=============我是换行符============
捕获组数,m.groupCount===2
m.group(0)===sssdf1256966
m.group(1)===sssdf
m.group(2)===1256966
=============我是换行符============

最后再附带下常用的正则表达式字符

字符的取值范围
1.[abc] : 表示可能是a,可能是b,也可能是c。
2.[^abc]: 表示不是a,b,c中的任意一个
3.[a-zA-Z]: 表示是英文字母
4.[0-9]:表示是数字 简洁的字符表示
.:匹配任意的字符
\d:表示数字
\D:表示非数字
\s:表示由空字符组成,[ \t\n\r\x\f]
\S:表示由非空字符组成,[^\s]
\w:表示字母、数字、下划线,[a-zA-Z0-9_]
\W:表示不是由字母、数字、下划线组成 数量表达式
1.?: 表示出现0次或1次
2.+: 表示出现1次或多次
3.*: 表示出现0次、1次或多次
4.{n}:表示出现n次
5.{n,m}:表示出现n~m次
6.{n,}:表示出现n次或n次以上 逻辑表达式
1.XY: 表示X后面跟着Y,这里X和Y分别是正则表达式的一部分
2.X|Y:表示X或Y,比如"food|f"匹配的是foo(d或f),而"(food)|f"匹配的是food或f
3.(X):子表达式,将X看做是一个整体

最新文章

  1. webServices与Web服务
  2. Chrome控制台 JS调试的一些小技巧
  3. 【Asphyre引擎】学习笔记(一)
  4. 每天一个linux命令(39):iostat命令
  5. js部分---类型,变量;
  6. iOS开发——UI篇OC篇&TextField作为搜索框的使用
  7. C++学习笔记-1-自增和自减运算符
  8. 本地存储 cookie,session,localstorage( 一)基本概念及原生API
  9. Grafana+Prometheus系统监控之MySql
  10. 多Region下HBase写入问题
  11. SSM框架+MySql保存emoji表情
  12. 02_编写Table的CRUD
  13. springboot集成quartz定时任务课动态执行
  14. nodejs cannot find module 'mysql' 问题分析
  15. (31)django中的分页器
  16. {MySQL完整性约束}一 介绍 二 not null与default 三 unique 四 primary key 五 auto_increment 六 foreign key 七 作业
  17. 【基础】selenium中元素定位的常用方法(三)
  18. 初入android驱动开发之字符设备(四-中断)
  19. 【翻译自mos中文文章】重建控制文件的方法
  20. 去掉iPhone、iPad的默认按钮样式

热门文章

  1. TensorFlow框架(1)之Computational Graph详解
  2. Tkinter 导入安装包
  3. hdu 3966 Aragorn's Story(树链剖分+树状数组/线段树)
  4. shell 之解释器、变量、字符串、数组
  5. 【搬运工】之——Selenium+IDEA+Maven+TestNG环境搭建(转)
  6. 深入理解 JavaScript 中的 replace 方法(转)
  7. spring配置datasource三种方式
  8. 关于JS正则——你知道多少?
  9. 小程序脚本语言WXS详解
  10. IT经典书籍——Head First系列【推荐】