一、AWK简介

awk:报告生成器,是以行为单位进行处理,并格式化后显示

awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。

二、AWK变量

2.1 awk内置变量之记录变量

FS: 默认是空白字符,指定输入分隔符
RS: 输入文本信息所使用的换行符
OFS: 输出字符分隔符
ORS: 输出行分隔符
FS or -F
[root@node1 ~]# cat test.txt
this is a test.
[root@node1 ~]# awk -F' ' '{print $0}' test.txt   FS可以使用-F选项,当没有使用-F选项的时候,awk默认-F选项为空格或者tab
this is a test.
[root@node1 ~]# awk '{print $0}' test.txt
this is a test.
RS

[root@node1 ~]# cat abc
1|2|3
[root@node1 ~]# awk 'BEGIN{RS="|"}{print $0}' abc   找到"|"符号,将它变成回车
1
2
3
OFS

[root@node1 ~]# cat test.txt
this is a test.
[root@node1 ~]# awk 'OFS=":"{print $1,$2,$3,$4}' test.txt 将文件的间隔由空格符换成分号
this:is:a:test.
ORS

[root@node1 ~]# cat abc

[root@node1 ~]# awk 'BEGIN{ORS="----\n"}{print $0}' abc   # 输出分隔符号。
----
----
----

2.2 awk内置变量之数据变量

NR: awk命令所处理的记录数 :如果有多个文件,这个数目会把处理的多个文件中行统一计数
FNR:与NR不同的是,FNR用于记录正处理的行是当前这一文件中被总共处理的行数
NF: 当前记录的字段个数
[root@node1 ~]# cat  test1  

[root@node1 ~]# cat test2 

NR

[root@node1 ~]# awk '{print NR}' test1 test2  # 两个文件行数之和

FNR

[root@node1 ~]# awk '{print FNR}' test1 test2  # 两个文件的行数分别显示出来
NF

[root@node1 ~]# cat test.txt
this is a test.
[root@node1 ~]# awk '{print NF}' test.txt   # NF是计算一行中的字段数 [root@node1 ~]# awk '{print $NF}' test.txt   # 而$NF则是一行中最后一个字段的简单表示方法
test.

三、printf
  printf命令的使用格式:
  printf format,item1,item2,...

要点:
  1、其与print命令的最大不同是,printf需要指定format;
  2、format用于指定后面的每个item的输出格式
  3、printf语句不会自动打印换行符;\n

format格式的指定符都以%开头,后跟一个字符,如下:
  %c: 显示字符的ASCII码;
  %s: 显示字符串

修饰符:
  N:显示宽度;
  -:左对齐
  +:显示数值符号

常见模式类型

  1、regexp:正则表达式,格式为/regular expression/
  2、expression:表达式,其值非0或为非空字符串时满足条件,如:$1 ~ /foo/ 或 $1 == "magedu",用运算符~(匹配)和!~(不匹配)
  3、ranges:指定的匹配范围,格式为part1,part2
  4、BEGIN/END:特殊模式,仅在awk命令执行前运行一次或结束前运行一次
  5、Empty(空模式):匹配任意输入行

例:取得/etc/passwd中每个用户名和shell格式化显示出来:

[root@node1 ~]# awk -F: '{printf "%-10s %-10s\n",$1,$NF}' /etc/passwd
root /bin/bash
bin /sbin/nologin
daemon /sbin/nologin
adm /sbin/nologin ......
[root@node1 ~]# awk -F: 'BEGIN{printf "%-10s %-10s\n","User","Shell"}{printf "%-10s %-10s\n",$1,$NF}' /etc/passwd
User Shell
root /bin/bash
bin /sbin/nologin
daemon /sbin/nologin
adm /sbin/nologin
lp /sbin/nologin
......

例:获取服务器tcp连接的每种状态数量

[root@node1 ~]# netstat -nat | awk '/^tcp/{++S[$NF]}END{for (i in S){print i,S[i]}}'
ESTABLISHED
LISTEN 4
/^tcp/  正则表达式: 匹配以tcp开头的行

{++S[$NF]}  获取每行的最后一个字节添加到数组,此时的S为数组 $NF为下标

END{for (i in S){print i,S[i]}}   处理完成后,通过下标循环打印出 下标 和 变量值
 

最新文章

  1. [systemtap手记]debian体系安装过程
  2. sass接触
  3. maven 本地仓库和远程仓库
  4. ExtJs4.1中给列表的单元格设置颜色
  5. HTML—one
  6. 数据库实例创建好后,用plsql登录居然提示ora-12526监听程序:所有适用例程都处于受限模式的问题
  7. (转载)有关反演和gcd
  8. OPENCV
  9. curl post参数,接口接收不到数据问题
  10. 在MAC下 Python+Django+mysql配置
  11. Linux下可执行程序调试信息的分离及release程序的调试
  12. 【蓝牙数据采集模块】-01-Sensor Controller 功能介绍
  13. javascript 面向对象基础 (1)
  14. JS 冒泡排序从学到优化
  15. Java范型
  16. 教我徒弟Android开发入门(一)
  17. python实现简单函数发生器
  18. BZOJ_3514_Codechef MARCH14 GERALD07加强版_主席树+LCT
  19. SQL Server的Descending Indexes
  20. php中header函数参数的Cache-control的使用方法

热门文章

  1. Word2vec之CBOW
  2. django类视图简单使用和源码解析
  3. Codeforces Round #326 Div.1 C.Duff in the Army 树上倍增
  4. Daily Scrum02 12.03
  5. 软工实践Beta冲刺(5/7)
  6. 用vs调试项目页面无样式
  7. Linux C++线程池实例
  8. PE文件格式介绍
  9. SQL Server Profiler的简单使用,方便查找和发现SQL执行的效率和语句问题
  10. Bootstrap中的Affix插件