sort +awk+uniq 统计文件中出现次数最多的前10个单词

实例
cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100.csharpcode, .csharpcode pre
{
font-size: small;
color: black;
font-family: consolas, "Courier New", courier, monospace;
background-color: #ffffff;
/*white-space: pre;*/
}
.csharpcode pre { margin: 0em; }
.csharpcode .rem { color: #008000; }
.csharpcode .kwrd { color: #0000ff; }
.csharpcode .str { color: #006080; }
.csharpcode .op { color: #0000c0; }
.csharpcode .preproc { color: #cc6633; }
.csharpcode .asp { background-color: #ffff00; }
.csharpcode .html { color: #800000; }
.csharpcode .attr { color: #ff0000; }
.csharpcode .alt
{
background-color: #f4f4f4;
width: 100%;
margin: 0em;
}
.csharpcode .lnum { color: #606060; }


使用linux命令或者shell实现:文件words存放英文单词,格式为每行一个英文单词(单词可以重复),统计这个文件中出现次数最多的前10个单词。

cat words.txt | sort | uniq -c | sort -k1,1nr | head –10

 

.csharpcode, .csharpcode pre
{
font-size: small;
color: black;
font-family: consolas, "Courier New", courier, monospace;
background-color: #ffffff;
/*white-space: pre;*/
}
.csharpcode pre { margin: 0em; }
.csharpcode .rem { color: #008000; }
.csharpcode .kwrd { color: #0000ff; }
.csharpcode .str { color: #006080; }
.csharpcode .op { color: #0000c0; }
.csharpcode .preproc { color: #cc6633; }
.csharpcode .asp { background-color: #ffff00; }
.csharpcode .html { color: #800000; }
.csharpcode .attr { color: #ff0000; }
.csharpcode .alt
{
background-color: #f4f4f4;
width: 100%;
margin: 0em;
}
.csharpcode .lnum { color: #606060; }

主要考察对sort、uniq命令的使用,相关解释如下,命令及参数的详细说明请自行通过man查看,简单介绍下以上指令各部分的功能:

sort:  对单词进行排序

uniq -c:  显示唯一的行,并在每行行首加上本行在文件中出现的次数

sort -k1,1nr:  按照第一个字段,数值排序,且为逆序

head -10:  取前10行数据

参考: http://man.linuxde.net/

最新文章

  1. 用ILSpy查看Session.SessionID的生成算法
  2. Javascript-DOM总结
  3. 【leetcode】Triangle (#120)
  4. 安装部署完office web apps 后,无法浏览Word
  5. Java IO5:字符流
  6. 匈牙利算法 codevs 2776 寻找代表元
  7. demo03linearlayoutdemo;
  8. Mac终端编译运行C++
  9. 用python查看URL编码的中文
  10. NOIP2005 过河
  11. html5判断用户摇晃了手机(转)
  12. http://aws.amazon.com/cn/ses/ 亚马逊 营销性非事务邮件发送平台
  13. MySql 初次安装登陆
  14. [C++STDlib基础]关于C标准输入输出的操作——C++标准库头文件<cstdio>
  15. js原生设计模式——2面向对象编程之继承—new+call(this)组合式继承
  16. Python OJ 从入门到入门基础练习 10 题
  17. MySQL系列详解七:MySQL双主架构演示-技术流ken
  18. 异常来自 HRESULT:0x80070057 (E_INVALIDARG)(转)
  19. OpenStack实践系列①openstack简介及基础环境部署
  20. mySql单列索引与联合索引的区别

热门文章

  1. Hive查询结果批量插入分区
  2. C#线程池用法
  3. SQL 语句中的union操作符
  4. IOS7学习之路九(ios7自定义UIAlertView)
  5. SOCKET网络编程细节问题3
  6. 【C#】调用DOS命令
  7. CSS3/jQuery自定义弹出窗口
  8. BST&AVL&红黑树简单介绍
  9. Composite C1是一个.Net平台上开源专业的CMS开源项目
  10. lua脚本中字符串分割split