Python词云(词频统计,掩膜显示)
2024-08-25 10:03:10
Python2.7 anaconda。安装Wordcloud,网上有许多下载路径,说一下掩模,就是在这个膜的区域才会有东西,当然这个与实际的掩模还有一定区别,这个词频显示是把所有统计的词,显示在这个掩模图片的非白色区域。
(接下来就不用看着网上那些小软件很羡慕,其实代码就十行左右,你也可以)
from os import path
from scipy.misc import imread
import matplotlib.pyplot as plt from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator # 获取当前文件路径
# __file__ 为当前文件, 在ide中运行此行会报错,可改为
# d = path.dirname('.')
d = path.dirname(__file__) #
text = open(path.join(d, 't.txt')).read() # 设置背景图片,也就是掩膜图像,在非白色部分我们的统计好的词频会显示在这里
alice_coloring = imread(path.join(d, "b.jpg")) wc = WordCloud(background_color="white", #背景颜色
#max_words=2000,# 词云显示的最大词数
mask=alice_coloring,#设置背景图片
stopwords=STOPWORDS.add("said"),
max_font_size=60, #字体最大值
random_state=50) #上述函数设计了词云格式 # 生成词云, 可以用generate输入全部文本(中文不好分词),也可以我们计算好词频后使用generate_from_frequencies函数
wc.generate(text)
#文本词频统计函数,本函数自动统计词的个数,以字典形式内部存储,在显示的时候词频大的,字体也大 # 从背景图片生成颜色值
image_colors = ImageColorGenerator(alice_coloring) # 以下代码显示图片 plt.figure()
# recolor wordcloud and show
# we could also give color_func=image_colors directly in the constructor
plt.imshow(wc.recolor(color_func=image_colors))
plt.axis("off")
# 绘制背景图片为颜色的图片
示例图像,文本分词是直接用的英文(网上随便粘贴一篇英文文章),它是以空格进行分词的。如果是中文也可以用网上推荐的分词器,或者你是做数据分析的,当然就知道怎么分词了。
bra................嘿嘿嘿
图片背景色为白色,分清图片背景,和掩模,和掩模背景色(函数默认的是白色区域)
词频分析,数据分析挖掘。
以后再PPT中也可以用啦!!!!!!!!!!!!!!!!!
最新文章
- Matlab 高斯_拉普拉斯滤波器处理医学图像
- 你可能不知道的python
- OC格式化标准符
- BZOJ4158 : [POI2007]Railway
- (转)《深入理解java虚拟机》学习笔记3——垃圾回收算法
- 初识JavaScript,感觉整个人都不好了。。。
- TPanel的默认颜色存储在dfm中,读取后在Paint函数中设置刷子的颜色,然后填充整个背景
- UVa 129 困难的串
- php注册登录源代码
- 为知笔记Linux版编译使用记录
- P1169 [ZJOI2007]棋盘制作 DP悬线法
- ie清理缓存
- ABAP 省市县级联搜索帮助
- 20190313 org.apache.commons.lang3.builder.EqualsBuilder的两种典型用法
- [TensorBoard] *Cookbook - Tensorboard
- Hyper-V 与 VMware 和 vbox 的不兼容
- Linux下鼠标滚轮速度调整
- 2019CSUST集训队选拔赛题解(二)
- 轻量级iOS安全框架:SSKeyChain
- bzoj 1715: [Usaco2006 Dec]Wormholes 虫洞 -- spfa判断负环
热门文章
- 机器学习进阶-图像形态学变化-礼帽与黑帽 1.cv2.TOPHAT(礼帽-原始图片-开运算后图片) 2.cv2.BLACKHAT(黑帽 闭运算-原始图片)
- Future Clalback使用案例
- Spark 调优(转)
- Tesseract-OCR4.0版本在VS2015上的编译与运行(转)
- servlet编码问题
- Java IO流学习总结六:ByteArrayInputStream、ByteArrayOutputStream
- OWASP_ZAP集成渗透测试和漏洞工具
- 运行vue项目--安装vue脚手架vue cli
- vmware搭建lnmp环境配置域名
- [cocos2d-x]游戏开发基础(图)