linux统计单词数
sort +awk+uniq 统计文件中出现次数最多的前10个单词
实例
cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100.csharpcode, .csharpcode pre
{
font-size: small;
color: black;
font-family: consolas, "Courier New", courier, monospace;
background-color: #ffffff;
/*white-space: pre;*/
}
.csharpcode pre { margin: 0em; }
.csharpcode .rem { color: #008000; }
.csharpcode .kwrd { color: #0000ff; }
.csharpcode .str { color: #006080; }
.csharpcode .op { color: #0000c0; }
.csharpcode .preproc { color: #cc6633; }
.csharpcode .asp { background-color: #ffff00; }
.csharpcode .html { color: #800000; }
.csharpcode .attr { color: #ff0000; }
.csharpcode .alt
{
background-color: #f4f4f4;
width: 100%;
margin: 0em;
}
.csharpcode .lnum { color: #606060; }
使用linux命令或者shell实现:文件words存放英文单词,格式为每行一个英文单词(单词可以重复),统计这个文件中出现次数最多的前10个单词。
cat words.txt | sort | uniq -c | sort -k1,1nr | head –10
.csharpcode, .csharpcode pre
{
font-size: small;
color: black;
font-family: consolas, "Courier New", courier, monospace;
background-color: #ffffff;
/*white-space: pre;*/
}
.csharpcode pre { margin: 0em; }
.csharpcode .rem { color: #008000; }
.csharpcode .kwrd { color: #0000ff; }
.csharpcode .str { color: #006080; }
.csharpcode .op { color: #0000c0; }
.csharpcode .preproc { color: #cc6633; }
.csharpcode .asp { background-color: #ffff00; }
.csharpcode .html { color: #800000; }
.csharpcode .attr { color: #ff0000; }
.csharpcode .alt
{
background-color: #f4f4f4;
width: 100%;
margin: 0em;
}
.csharpcode .lnum { color: #606060; }
主要考察对sort、uniq命令的使用,相关解释如下,命令及参数的详细说明请自行通过man查看,简单介绍下以上指令各部分的功能:
sort: 对单词进行排序
uniq -c: 显示唯一的行,并在每行行首加上本行在文件中出现的次数
sort -k1,1nr: 按照第一个字段,数值排序,且为逆序
head -10: 取前10行数据
最新文章
- 用ILSpy查看Session.SessionID的生成算法
- Javascript-DOM总结
- 【leetcode】Triangle (#120)
- 安装部署完office web apps 后,无法浏览Word
- Java IO5:字符流
- 匈牙利算法 codevs 2776 寻找代表元
- demo03linearlayoutdemo;
- Mac终端编译运行C++
- 用python查看URL编码的中文
- NOIP2005 过河
- html5判断用户摇晃了手机(转)
- http://aws.amazon.com/cn/ses/ 亚马逊 营销性非事务邮件发送平台
- MySql 初次安装登陆
- [C++STDlib基础]关于C标准输入输出的操作——C++标准库头文件<;cstdio>;
- js原生设计模式——2面向对象编程之继承—new+call(this)组合式继承
- Python OJ 从入门到入门基础练习 10 题
- MySQL系列详解七:MySQL双主架构演示-技术流ken
- 异常来自 HRESULT:0x80070057 (E_INVALIDARG)(转)
- OpenStack实践系列①openstack简介及基础环境部署
- mySql单列索引与联合索引的区别