[Python] 通过采集23万条数据,对《哪吒》影评分析
2024-09-07 01:52:52
一、说明
数据来源:猫眼;
运行环境:Win10/Python3.7 和 Win7/Python3.5;
分析工具:jieba、WorldCloud、pyecharts和matplotlib;
程序基本思路:分析接口 —> 下载数据 —> 过滤数据 —> 保存文件 —> 统计分析;
注意:本文所有图文和源码仅供学习,请勿他用,转发请注明出处!
参考:https://www.cnblogs.com/reader/p/10070629.html
二、开始
样本数据(23万+):
因为运行的脚本和之前基本差不多,对于数据采集和统计分析的流程直接参考:https://www.cnblogs.com/reader/p/10070629.html
优化下载部分代码,防止因网络原因导致下载失败,导致的程序停止(这里也可以考虑设置重试下载次数):
def download(self, url):
"""下载内容"""
self.showstep('Downloading:'+url) # 防止网络原因导致下载失败
while True:
try:
response = requests.get(url, headers=self.headers) if response.status_code == 200:
return response.json()
else:
self.showstep('Download Fail:' + url)
return ""
except Exception as e:
print(e)
time.sleep(3)
三、图形化分析
3.1 观众城市分布热点图
3.2 观众位置分布图
3.3 城市分布人数排行 TOP 20
3.4 词云
最新文章
- 数据仓库开发——Kettle使用示例
- SQL2008 无日志附加MDF文件
- 06OC之内存管理
- Java数据结构之表的增删对比---ArrayList与LinkedList之一
- 解决winrar压缩软件弹出广告
- css 字体不撑开默认块级元素问题
- 11g RAC r2 的启停命令概述1
- eclipse加入git工具
- Ubuntu 之旅—— 调整扩展屏分辨率
- 代理模式 - OK
- shell的数组操作
- jquery查找元素
- DragVideo,一种在播放视频时,可以任意拖拽的方案
- PHP算法学习(6) 单向链表 实现栈
- Java设计模式知识整理
- 运行纯PHP程序的时候,不应该加";?>;";结束语
- Ubuntu 关闭触摸板
- Linux中运行SpringBoot项目,永久运行
- php解析优酷网上的视频资源去广告
- [转]Linux系统下如何查看及修改文件读写权限