http://www.360doc.com/content/10/0811/00/84590_45147637.shtml

英美在互联网具有绝对霸权

Zipf定律是美国学者G.K.齐普夫提出的。可以表述为:在自然语言的语料库里,一个单词出现的次数与它在频率表里的排名成反比。

Zipf定律描述

编辑

1935年,哈佛大学的 语言学专家Zipf在研究英文单词出现的频率时,发现如果把单词出现的频率按由大到小的顺序排列,则每个单词出现的频率与它的名次的常数次幂存在简单的反 比关系,这种分布就称为Zipf定律,它表明在英语单词中,只有极少数的词被经常使用,而绝大多数词很少被使用.实际上,包括汉语在内的许多国家的语言都 有这种特点。这个定律后来在很多领域得到了同样的验证,包括网站的访问者数量、城镇的大小和每个国家公司的数量。

Zipf其人

编辑

George Kingsley Zipf 1902年1月出生于一个德裔家庭(其祖父十九世纪中叶移居美国)。1924年,他以优异成绩毕业于哈佛学院。1925年在德国波 恩、柏林学习。1929年完成Relative Frequency as a Determinant of Phonetic Change,获得哈佛比较语文学博士学位。然后,他开始在哈佛教授德语。1931年与Joyce Waters Brown结婚。1932年出版Selected Studies of the Principle of Relative Frequency in Language。1935年出版The Psycho- Biology of Language:An Introduction to Dynamic Philology。1939年被聘为讲师。1949年出版Human Behavior and the Principle of Least Effort:An Introduction to Human Ecology。1950年9月因患癌症病逝。(Prün & Zipf 2002)

Zipf应用

编辑

相信你一定听过这样的说法:
80%的财富集中在20%的人手中……
80%的用户只使用20%的功能……
20%的用户贡献了80%的访问量……
…………
你知道我在说“二八原则”或“20/80原则”,是的,没错!
-----------
如果把所有的单词(字)放在一起看呢?会不会20%的词(字)占了80%的出现次数?答案是肯定的。
早在上个世纪30年代,就有人(Zipf)对此作出了研究,并给出了量化的表达——齐普夫定律(Zipf's Law):一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。用公式表示,就是 r × f = C 。(此处的C一般认为取0.1)
Zipf定律是文献计量学的重要定律之一,它和洛特卡定律布拉德福定律一起被并称为文献计量学的三大定律。
Zipf的专业是比较语文学,但是,以其名字命名的定律却早已走出语言学,进入了信息学、计算机科学、经济学、社会学、生物学、地理学、物理学等众多研究领域 ,在学术界享有极高的声誉。
齐夫定律已经在语言学、情报学、地理学、经济学、信息科学等领域有了广泛的应用,而且取得了不少可喜成果。中国数学家和语言学家周海中曾经指出:齐夫定律是描述词频分布规律的强大数学工具;作为经验定律,它仍有不足之处,有待进一步完善。[1] 
 
 
 

最新文章

  1. ASP.NET Web API WebHost宿主环境中管道、路由
  2. 20145205 《Java程序设计》第9周学习总结
  3. Parallel 试验
  4. composer--------初体验,如何安装,如何下载
  5. MapReduce简介
  6. 达内培训:php在线端口扫描器
  7. 【转载】Morris遍历二叉树 & BST(二叉搜索树) Traverse & 空间O(1) 时间O(n)
  8. JavaScript高级程序设计(第三版)学习笔记13、14章
  9. Spring三 Bean的三种创建方式
  10. Dump 文件生成与分析
  11. 从零開始开发Android版2048 (四) 分数、重置、结束
  12. Appium - iOS 各种问题汇总
  13. WPF控制动画开始、停止、暂停和恢复
  14. MySQL性能优化总结___本文乃《MySQL性能调优与架构设计》读书笔记!
  15. webapi 控制json的字段(key)显示顺序
  16. 下载Chrome商店和Youtube资源
  17. #11 Python字典
  18. Mysql存储引擎特性总结
  19. python---面对对象的三大特征
  20. 基础笔记1(进制,浮点,递归,floor,round和ceil)

热门文章

  1. HTML5+AJAX原生分块上传文件的关键参数设置
  2. 1019在winddow上面安装MYSQL服务
  3. PHP与MySQL
  4. cxf和spring结合,发布restFull风格的服务
  5. MyBatis特殊字符转义
  6. MySQL多实例
  7. [转]理解JavaScript中的事件处理
  8. 创建mysql 存储过程
  9. GIT之旅【第一篇】
  10. Chrome DevTools good good study day day up