1、grep命令介绍

grep命令:是一个Shell命令,是Shell中文本三剑客之一,作用是在文件中提取和匹配符合条件的字符串行

grep命令是一个非常常见的命令,和find命令有很多非常相似的地方,所以在这里先说明。

grep命令格式如下:

[root@localhost ~ ]# grep [选项] “搜索内容” 文件名

选项:
-i:忽略大小写
-n:输出行号(显示原始文件中的行号)
-v:反向查找
--color=auto:搜索出的关键字用颜色显示

举例:

# 输出行号。
[root@localhost ~]# grep -n"123" abc
3:123abc
4:123abcdef123
5:abc 123
6:123aaaaabc
7:123bc
8:123aabc
10:abc123abc # 把你要搜索的内容用红色高亮显示。
[root@localhost ~]# grep --color=auto "123" abc

注意:如果要搜索的内容中没有空格,“搜索内容”部分就可以不加双引号,如果“搜索内容”中有空格,则一定要加双引号。

2、find命令和grep命令的区别(重点)

(1)find命令

find命令用于在系统中搜索符合条件的文件名,如果需要模糊查询,则使用通配符进行匹配,通配符是完全匹配。

提示:find命令可以通过-regex选项,把匹配规则转为正则表达式规则,但是不建议如此。

(2)grep命令

grep命令用于在文件中搜索符合条件的字符串,如果需要模糊查询,则使用正则表达式进行匹配,正则表达式是包含匹配。

注意:完全匹配和包含匹配的规则不是find命令和grep命令的区别,是通配符正则表达式的区别。

3、通配符与正则表达式的区别

(1)通配符:

用于匹配文件名,是完全匹配。

下面举例说明:

  • ?:匹配一个任意字符。
  • *:匹配0个或任意多个任意字符,也就是可以匹配任何内容。
  • []:匹配中括号中任意一个字符。例如:[abc]代表一定匹配一个字符,或者是a,或者是b,或者是c
  • [-]:匹配中括号中任意一个字符,-代表一个范围。例如:[a-z]代表匹配一个小写字母。
  • [\^]:逻辑非,表示匹配不是中括号内的一个字符。例如:[\^0-9]代表匹配一个不是数字的字符。
# 通过通配符查找文件
[root@localhost ~ ] # find . -name "abc*"
./abcd
./abc [root@localhost ~ ]# find . -name "a?c"
./acc
./abc # 其他同理

提示:只要是操作文件名或者目录名的命令都可以是用通配符。如rm命令。

(2)正则表达式:

用于匹配字符串,是包含匹配。

下面简单举例:

  • ?:匹配前一个字符重复0次,或1次(?是扩展正则,需要使用egrep命令。注Shell分为标准正则和扩展正则。)。
  • *:匹配前一个字符重复0次,或任意多次。
  • []:匹配中括号中任意一个字符。例如:[abc]代表一定匹配一个字符,或者是a,或者是b,或者是c
  • [-]:匹配中括号中任意一个字符,-代表一个范围。例如:[a-z]代表匹配一个小写字母。
  • [\^]:逻辑非,表示匹配不是中括号内的一个字符。例如:[\^0-9]代表匹配一个不是数字的字符。
  • ^:匹配行首(限位符)。
  • $:匹配行尾(限位符)。

其中主要是是?*,在通配符和正则表达式的不同。

关于*注意:

[root@localhost ~ ] # grep "a*" abc

向上面命令中,单写一个字母+*是没有任何意义的。结果会显示文件中所有内容,包括空白行。

因为*是匹配前一个字符重复0次,或任意多次。0次代表什么都没有,也就是没有条件的筛选,所以就显示文件汇总所有的内容。

[root@localhost ~ ] # grep "aa*" abc命令,则表示查找文件中包含有小写字母a的行。和开头无关,正则是含有匹配,包含就会被列出。

如果想要在正则当中去匹配开头的内容,就需要使用限位符。如下:

[root@localhost ~]  # grep "^a" abc
abc
abc 123
abc123abc [root@localhost ~] # grep "^aa*" abc 和上面查询结果也一样。

小练习:

[root@localhost ~]# egrep"aaa?" abc
123aaaaabc
123aabc
# 上面证明是包含匹配 [root@localhost ~j# egrep "3aaa?b"abc
123aabc
[root@localhost ]#
# 如果只想要搜索两个a的字符串,就需要使用限位符,其中的3和b都属于限位符。
# 限位符是包括自己与其他字符串不匹配的任何字符的统称。

最新文章

  1. 使用 PowerShell 自动化 CloudServices 发布
  2. LoopBackJS 之 文件上传下载——使用loopback-component-storage
  3. http学习笔记(一)
  4. sqlite与android交互 (封装)
  5. 关于conversation generation的论文笔记
  6. linux c 分解质因数
  7. java 中 ==和equals 的区别
  8. 自制Javascript分页插件,支持AJAX加载和URL带参跳转两种初始化方式,可用于同一页面的多个分页和不同页面的调用
  9. C++的封装性
  10. swift 协议传值的实现
  11. JavaScript Window Navigator
  12. 在ubuntu的bash中循环执行脚本,并在内存不足时重启
  13. QR 编码原理(三)
  14. Python+Selenium学习--控制浏览器控制条
  15. RNN,LSTM中如何使用TimeDistributed包装层,代码示例
  16. 【Spring Security】六、自定义认证处理的过滤器
  17. Mongodb安装超长等待
  18. 什么是MySQL
  19. PHP7新特性 What will be in PHP 7/PHPNG
  20. 30.概述strust2中的拦截器

热门文章

  1. P5631-最小mex生成树【线段树,并查集】
  2. 一篇文章搞定Selenium元素定位/封装/数据驱动
  3. EF Core Sequence contains no elements
  4. 学习Tomcat(六)之类加载器
  5. 使用ffmpeg进行视频图片提取
  6. 技术番外篇丨Github Action CI/CD
  7. mybatis 操作数据库(05)
  8. Golang通脉之数组
  9. Mybatis 动态批量修改
  10. 第二次Alpha Scrum Meeting