python学习(七)--豆瓣爬取电影名,评分以及演员
2024-09-28 13:59:33
import requests
import re #爬取豆瓣电影排名
pageNum = int(input("要查看第几页电影分数:"))
#已知豆瓣默认每页展示20条
#url= "https://movie.douban.com/j/chart/top_list?type=11&interval_id=100%3A90&action=&start=0&limit=20"
url= "https://movie.douban.com/j/chart/top_list?type=11&interval_id=100%3A90&action=&start="+str((pageNum-1)*20)+"&limit=20"
#评分 "rating":["9.6","50"] 此处有中括号[],尽管加了r表示不转译,但是不加斜杠\,仍然匹配不到。
pattern1 = r'"rating":\["(.*?)","\d+"\]'
#电影名
pattern2 = r'"title":"(.*?)"'
#电影演员
pattern3 = r'"actors":\[(.*?)\]'
data = requests.get(url).text
print(data)
pat1 = re.compile(pattern1)
pat2 = re.compile(pattern2)
pat3 = re.compile(pattern3)
list1 = pat1.findall(data)
list2 = pat2.findall(data)
list3 = pat3.findall(data)
print(list1)
print(list2)
print(list3)
list = []
for i in range(0,len(list1)):
list.append(list2[i]+":"+list1[i]+"分,演员:"+list3[i]) print("---------------------------------------------")
for i in list:
print(i)
最新文章
- OSI参考模型及各层功能,TCP与UDP的区别
- mybatis配置优化
- (1)c语言学习总结之从关键字到循环结构
- UPDATE语句中使用JOIN
- Wince 中如何实现注册表恢复原厂设置
- Android粘贴板的运用
- angularjs页面传参
- 修改jmeter jvm参数
- NOI2002 荒岛野人
- IDM和ODM
- 关于后台数据库正常存储中文通过Ajax方式传递到前台变成问号的处理
- ASP.NET - 出错页
- 验证SQLServer死锁进程
- Ext中defaults与fieldDefaults
- c/c++拷贝构造函数和关键字explicit
- KVM安装启动虚拟机
- brew安装和换源
- IIS服务器多站点 的 https证书使用443端口 解决方案
- show profiles 分析sql耗时瓶颈
- asp.net mvc接收安卓post的json字符串
热门文章
- 在win7系统上搭建django+oracle 11g时,注意事项
- centos6.5 git clone http 报错
- 自动备份数据库crond
- 4.SVM
- I/O(输入/输出)---序列化与反序列化
- 《Andrew Ng深度学习》笔记1
- (转)取消目录与SVN的关联
- SprimgMVC学习笔记(十)—— 拦截器
- Android SharedPreferences应用实例(记录App的使用次数)
- [BZOJ 4923][Lydsy1706月赛]K小值查询