Python3 数据结构之词频统计(英文)
2024-09-01 20:08:31
import string
path = r'C:\Users\Black\Desktop\Walden.txt'
with open(path, 'r', encoding='utf-8') as text:
# 列表推导式,去除标点符号, 首字母大写转化为小写
words = [raw_word.strip(string.punctuation).lower() for raw_word in text.read().split()]
# 去重
words_index = set(words)
# 创建一个以单词为键, 频率为值得字典
counts_dict = {index: words.count(index) for index in words_index}
# 借助匿名函数,按频率降序排列
for word in sorted(counts_dict, key=lambda x: counts_dict[x], reverse=True):
print(f'{word}-{counts_dict[word]} times')
最新文章
- 这个图片切换动画只用CSS3实现
- 【USACO 2.3】The Longest Prefix
- Android二维码功能实现,在程序内嵌入ZXing项目
- Nexus4铃声目录
- Eclipse UML插件AmaterasUML的配置及使用
- Android UI--ViewPager扩展Tab标签指示
- UVA 10312 - Expression Bracketing(数论+Catalan数)
- 更好的自动ssh登录
- [Q]手动加载菜单方法
- DNS:域名系统
- Android 使用EventBus发送消息接收消息
- Docker 安装Hadoop HDFS命令行操作
- 完全分布式hadoop2.5.0安装 VMware下虚拟机centos6.4安装1主两从hadoop
- 全网最详细的HBase启动以后,HMaster进程启动了,几秒钟以后自动关闭问题的解决办法(图文详解)
- 【转】1.2 CDN的基本工作过程
- mysql hive sql 进阶
- jenkins升级
- Python类总结-字段,方法,属性区别及StaticMethod, Property,私有字段和私有属性
- 使用maven为web工程引入jstl包时报错了
- sql 优化的几种方法
热门文章
- Netty学习篇⑤--编、解码
- java编程思想第四版第十四章 类型信息总结
- 堡垒机的核心武器:WebSSH录像实现
- java.lang.NoSuchMethodError: org.apache.tomcat.JarScanner.scan(Ljavax/servlet/ServletContext;Ljava/lang/ClassLoader;Lorg/apache/tomcat/JarScannerCallback;Ljava/util/Set;)V
- 新闻网页通用抽取器GNEv0.04版更新,支持提取正文图片与源代码
- beta week 1/2 Scrum立会报告+燃尽图 02
- html基础——a标签
- 教你用Java web实现多条件过滤功能
- es5设置属性不能修改
- ctf线下赛中关闭非法用户shell脚本