import requests
import re #爬取豆瓣电影排名
pageNum = int(input("要查看第几页电影分数:"))
#已知豆瓣默认每页展示20条
#url= "https://movie.douban.com/j/chart/top_list?type=11&interval_id=100%3A90&action=&start=0&limit=20"
url= "https://movie.douban.com/j/chart/top_list?type=11&interval_id=100%3A90&action=&start="+str((pageNum-1)*20)+"&limit=20"
#评分 "rating":["9.6","50"] 此处有中括号[],尽管加了r表示不转译,但是不加斜杠\,仍然匹配不到。
pattern1 = r'"rating":\["(.*?)","\d+"\]'
#电影名
pattern2 = r'"title":"(.*?)"'
#电影演员
pattern3 = r'"actors":\[(.*?)\]'
data = requests.get(url).text
print(data)
pat1 = re.compile(pattern1)
pat2 = re.compile(pattern2)
pat3 = re.compile(pattern3)
list1 = pat1.findall(data)
list2 = pat2.findall(data)
list3 = pat3.findall(data)
print(list1)
print(list2)
print(list3)
list = []
for i in range(0,len(list1)):
list.append(list2[i]+":"+list1[i]+"分,演员:"+list3[i]) print("---------------------------------------------")
for i in list:
print(i)

最新文章

  1. OSI参考模型及各层功能,TCP与UDP的区别
  2. mybatis配置优化
  3. (1)c语言学习总结之从关键字到循环结构
  4. UPDATE语句中使用JOIN
  5. Wince 中如何实现注册表恢复原厂设置
  6. Android粘贴板的运用
  7. angularjs页面传参
  8. 修改jmeter jvm参数
  9. NOI2002 荒岛野人
  10. IDM和ODM
  11. 关于后台数据库正常存储中文通过Ajax方式传递到前台变成问号的处理
  12. ASP.NET - 出错页
  13. 验证SQLServer死锁进程
  14. Ext中defaults与fieldDefaults
  15. c/c++拷贝构造函数和关键字explicit
  16. KVM安装启动虚拟机
  17. brew安装和换源
  18. IIS服务器多站点 的 https证书使用443端口 解决方案
  19. show profiles 分析sql耗时瓶颈
  20. asp.net mvc接收安卓post的json字符串

热门文章

  1. 在win7系统上搭建django+oracle 11g时,注意事项
  2. centos6.5 git clone http 报错
  3. 自动备份数据库crond
  4. 4.SVM
  5. I/O(输入/输出)---序列化与反序列化
  6. 《Andrew Ng深度学习》笔记1
  7. (转)取消目录与SVN的关联
  8. SprimgMVC学习笔记(十)—— 拦截器
  9. Android SharedPreferences应用实例(记录App的使用次数)
  10. [BZOJ 4923][Lydsy1706月赛]K小值查询