Python2.7 anaconda。安装Wordcloud,网上有许多下载路径,说一下掩模,就是在这个膜的区域才会有东西,当然这个与实际的掩模还有一定区别,这个词频显示是把所有统计的词,显示在这个掩模图片的非白色区域。

(接下来就不用看着网上那些小软件很羡慕,其实代码就十行左右,你也可以)

from os import path
from scipy.misc import imread
import matplotlib.pyplot as plt from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator # 获取当前文件路径
# __file__ 为当前文件, 在ide中运行此行会报错,可改为
# d = path.dirname('.')
d = path.dirname(__file__) #
text = open(path.join(d, 't.txt')).read() # 设置背景图片,也就是掩膜图像,在非白色部分我们的统计好的词频会显示在这里
alice_coloring = imread(path.join(d, "b.jpg")) wc = WordCloud(background_color="white", #背景颜色
#max_words=2000,# 词云显示的最大词数
mask=alice_coloring,#设置背景图片
stopwords=STOPWORDS.add("said"),
max_font_size=60, #字体最大值
random_state=50) #上述函数设计了词云格式 # 生成词云, 可以用generate输入全部文本(中文不好分词),也可以我们计算好词频后使用generate_from_frequencies函数
wc.generate(text)
#文本词频统计函数,本函数自动统计词的个数,以字典形式内部存储,在显示的时候词频大的,字体也大 # 从背景图片生成颜色值
image_colors = ImageColorGenerator(alice_coloring) # 以下代码显示图片 plt.figure()
# recolor wordcloud and show
# we could also give color_func=image_colors directly in the constructor
plt.imshow(wc.recolor(color_func=image_colors))
plt.axis("off")
# 绘制背景图片为颜色的图片


  示例图像,文本分词是直接用的英文(网上随便粘贴一篇英文文章),它是以空格进行分词的。如果是中文也可以用网上推荐的分词器,或者你是做数据分析的,当然就知道怎么分词了。

bra................嘿嘿嘿

图片背景色为白色,分清图片背景,和掩模,和掩模背景色(函数默认的是白色区域)

词频分析,数据分析挖掘。

以后再PPT中也可以用啦!!!!!!!!!!!!!!!!!

最新文章

  1. Matlab 高斯_拉普拉斯滤波器处理医学图像
  2. 你可能不知道的python
  3. OC格式化标准符
  4. BZOJ4158 : [POI2007]Railway
  5. (转)《深入理解java虚拟机》学习笔记3——垃圾回收算法
  6. 初识JavaScript,感觉整个人都不好了。。。
  7. TPanel的默认颜色存储在dfm中,读取后在Paint函数中设置刷子的颜色,然后填充整个背景
  8. UVa 129 困难的串
  9. php注册登录源代码
  10. 为知笔记Linux版编译使用记录
  11. P1169 [ZJOI2007]棋盘制作 DP悬线法
  12. ie清理缓存
  13. ABAP 省市县级联搜索帮助
  14. 20190313 org.apache.commons.lang3.builder.EqualsBuilder的两种典型用法
  15. [TensorBoard] *Cookbook - Tensorboard
  16. Hyper-V 与 VMware 和 vbox 的不兼容
  17. Linux下鼠标滚轮速度调整
  18. 2019CSUST集训队选拔赛题解(二)
  19. 轻量级iOS安全框架:SSKeyChain
  20. bzoj 1715: [Usaco2006 Dec]Wormholes 虫洞 -- spfa判断负环

热门文章

  1. 机器学习进阶-图像形态学变化-礼帽与黑帽 1.cv2.TOPHAT(礼帽-原始图片-开运算后图片) 2.cv2.BLACKHAT(黑帽 闭运算-原始图片)
  2. Future Clalback使用案例
  3. Spark 调优(转)
  4. Tesseract-OCR4.0版本在VS2015上的编译与运行(转)
  5. servlet编码问题
  6. Java IO流学习总结六:ByteArrayInputStream、ByteArrayOutputStream
  7. OWASP_ZAP集成渗透测试和漏洞工具
  8. 运行vue项目--安装vue脚手架vue cli
  9. vmware搭建lnmp环境配置域名
  10. [cocos2d-x]游戏开发基础(图)