前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

我相信很多观众会和我一样吧,当TES赢下第一局后开始心怀侥幸,赢下第二局后觉得有了有了,当赢下第三局后,对嘛这才是TES。

从未有支战队在S赛8进4完成让二追三,但TES他们做到了,创造了奇迹。

恭喜TES顺利进入4强,也希望之后的比赛继续带给我们精彩的对决!

本次目标

爬取B站弹幕,并词云显示

目标地址

https://www.bilibili.com/video/BV1zA41177FQ?spm_id_from=333.851.b_7265706f7274466972737433.2

开发工具

  • python 3.6.5
  • pycharm

爬虫代码

导入工具

import requests
import re

安装相关的库即可

完整代码

for page in range(17, 20):
url = 'https://api.bilibili.com/x/v2/dm/history?type=1&oid=246648707&date=2020-10-{}'.format(page)
headers = {
'cookie': '_uuid=50D22ECF-208D-9409-DEA1-0B3EA3F74AB793744infoc; buvid3=A0FE83C2-5981-40DC-B0E2-C74A37227ECF155818infoc; rpdid=|(umuummlkY~0J\'ulm|ullmll; sid=kr4i59d5; LIVE_BUVID=AUTO3215909029132687; blackside_state=1; CURRENT_FNVAL=80; DedeUserID=406732493; DedeUserID__ckMd5=48c43aca436bb747; SESSDATA=204f478b%2C1615703177%2C53385*91; bili_jct=08d11cd34efbf3da0d2138d562145e5c; PVID=1; dy_spec_agreed=1; bsource=search_baidu; bfe_id=6f285c892d9d3c1f8f020adad8bed553; bp_video_offset_406732493=446718397413729260; bp_t_offset_406732493=447756572613788019',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
response.encoding = response.apparent_encoding
lis = re.findall('<d p=".*?">(.*?)</d>', response.text, re.S)
for i in lis:
with open('八强赛弹幕.txt', mode='a', encoding='utf-8') as f:
f.write(i)
f.write('\n')
print(i)

运行代码,效果如下图

现在有数据了可以开始动手做词云了

词云代码

导入工具

import jieba
import wordcloud
import imageio

完整代码

py = imageio.imread(r"图片地址")
# 读取文件内容
f = open(r'弹幕数据地址', encoding='utf-8')
txt = f.read()
# print(txt)
# jiabe 分词 分割词汇
txt_list = jieba.lcut(txt)
string = ' '.join(txt_list)
# 词云图设置
wc = wordcloud.WordCloud(
width=1000, # 图片的宽
height=700, # 图片的高
background_color='white', # 图片背景颜色
font_path='msyh.ttc', # 词云字体
mask=py, # 所使用的词云图片
scale=15,
stopwords={'真的', '这个'},
# contour_width=5,
# contour_color='red' # 轮廓颜色
)
# 给词云输入文字
wc.generate(string)
wc.to_file(r'保存图片地址')

运行代码

最新文章

  1. Unity3D游戏在iOS上因为trampolines闪退的原因与解决办法
  2. error in config file &quot;/etc/rabbitmq/rabbitmq.config&quot;
  3. 安装scrapy
  4. JS操作URL
  5. Protobuf-net基础
  6. 数据库导出到excel
  7. MySQL大小写敏感问题和命名规范
  8. 「WC 2018」州区划分
  9. 文本相似度 — TF-IDF和BM25算法
  10. Codeforces 870C Maximum splitting (贪心+找规律)
  11. 淘淘商城之springmvc和mybatis整合
  12. Android截图命令screencap与视频录制命令screenrecord
  13. [No0000176]Git常用命令速查表(收藏大全)
  14. setUp和tearDown及setUpClass和tearDownClass的用法及区别
  15. 【CDH学习之二】ClouderaManager安装
  16. C# 实现图片压缩
  17. C++函数不能为virtual的场景
  18. 【快速查阅】SQLPLUS连接ORACLE
  19. Qracle 11g 插图安装
  20. jdk和tomcat版本对应

热门文章

  1. 恭喜!Apache Hudi社区新晋多位Committer
  2. xss原理解析
  3. mysql浅谈--事务ACID特性
  4. [算法题]最小m划分(划分DP)
  5. Linux中逻辑卷(LV)的创建、增大和减小
  6. 写一个简单的 Linux Shell (C++)
  7. use-default-filters的用法
  8. ZooKeeper学习(二)ZooKeeper实现分布式锁
  9. MySQL中的临时表到底什么是?
  10. 一些JAVA题目