前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:简单

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun

对于小说鬼吹灯,相信很多人都知道,它可谓是国内盗墓寻宝系列小说的巅峰之作,最近得知该系列小说的《龙岭迷窟》部分被制作成了网剧,已经于 4 月 1 日开播了,主要演员潘粤明、姜超、张雨绮等都是一些大家比较熟悉的面孔,网剧质量、剧情还原度等到底怎么样呢?我们通过本文来简单了解一下。

我们都知道要了解一件事情是需要用数据说话的,本文数据来源我们还是选择豆瓣的评论区数据吧

目前已经有3万6千多人参与了评分且打 4 星和 5 星的人数居多,总体评分 8.3,算是一个比较优秀的分数了。

接着我们将网页向下拉到短评位置,如下所示:

目前有8千多人写了短评,但我们知道豆瓣最多只能查看 500 条短评数据,我们的数据来源就取 500 条短评数据。

获取数据

首先,我们通过 Python 爬取《龙岭迷窟》 500 条豆瓣短评数据,代码的具体细节这里就不说了免得篇幅过长。

我们爬取的数据项包括:评论用户、评论时间、评论星级、评论内容。

分析数据

数据我们已经取到了,接下来我们开始对所获取的数据进行分析。

评论数量

首先,我们来看一下不同时间用户的评论数量

看一下效果图:

尽管该剧截止目前只有 4 天的评论数据,我们从图中也不难发现一些规律:我们可以看出 4 月 1 日和 2 日两天的评论数量较多,其中 4 月 1 日为首播日,评论数量多合乎情理,而 4 月 2 日评论数量多于 4 月 1 日,我们可以推测是因为该剧播出之后迅速传播的结果,也就是让更多的人知道了该剧,之后随着时间的推移热度会有所下降,评论数量呈递减的趋势,评论数量变化的趋势也侧面反映了该剧热度变化的大致趋势。

人物角色

接着,我们来看所获取的评论数据中,剧中主要角色被提及的次数。

看一下效果图:

从图中我们可以看出被提及角色数量的前三甲为:胡八一、王胖子、大金牙,通过角色被提及的次数,我们也可以大致推测出剧中角色的受欢迎程度。

评论星级

再接着,我们看一下该剧每天用户的评论星级,星级最高为 5 星,一天中如果有多条评论星级数据,我们则取其平均值。

看一下效果图:

我们从图中可以看出该剧评论星级大致维持在 4 星以上,说明大部分用户对于该剧的质量是比较认可的,评论星级也基本反映出了用户对于该剧的满意度。

词云展示

最后,我们对评论内容进行词云展示,看一下哪些词汇才是评论区的热门词汇。

看一下效果图:

总结

评分 8.3 评分 F 型 评论人数近 3.6W结论:评分有效,口碑很好,值得一看

2020年最新Python教程:

如果你处于想学Python或者正在学习Python,Python的教程不少了吧,但是是最新的吗?

说不定你学了可能是两年前人家就学过的内容,在这小编分享一波2020最新的Python教程。

以上这些教程小编已经为大家打包准备好了,希望对正在学习的你有所帮助!

获取方式,私信小编 “ 资料 ”,即可免费获取哦!

最新文章

  1. JavaScript 字符串实用常操纪要
  2. 大神的Blog挂了,从Bing快照里复制过来的备份
  3. python与shell的3种交互方式介绍
  4. ural 1142. Relations
  5. 2016年12-09php函数
  6. AC日记——过河卒 洛谷 1002
  7. Ubuntu系统启动过程详解
  8. Cocos移植到Android-通过命令行交叉编译打包
  9. redis数据类型(字符串)
  10. java多线程基本概述(三)——同步方法
  11. Centos7安装jdk-12的详细过程
  12. 基于 HTML5 WebGL 的地铁站 3D 可视化系统
  13. Xposed免重启调试工具类
  14. [转帖]国产闪存颗粒终于熬出头 紫光存储S100固态硬盘评测
  15. js弹出层
  16. python3.4爬取网页的乱码问题
  17. Docker Compose安装以及入门
  18. stlcky footers布局小技巧
  19. python——列表入门
  20. Android Service基础知识你知道多少?

热门文章

  1. PyCharm导入selenium的webdirver模块出错
  2. hdu1429 胜利大逃亡(续)???天天逃亡???
  3. 《大空头》与A股内幕消息
  4. [二分]codeforces 274A k-Multiple Free Set
  5. IP协议的助手 —— ICMP 协议
  6. Jmeter接口测试实战之HTTP Cookie管理器(十二 )
  7. 常见Web安全漏洞--------sql注入
  8. MATLAB 文件读取(3)
  9. Q - 迷宫问题 POJ - 3984(BFS / DFS + 记录路径)
  10. jmeter发送Query String Parameters格式参数报错