import urllib3
import re
# 下载百度首页页面的所有图片
# 1. 找到目标数据
# page_url = 'http://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gb18030&word=%CD%BC%C6%AC&fr=ala&ala=1&alatpl=others&pos=0'
# http = urllib3.PoolManager()
# res = http.request('get',page_url)
# print(res.data.decode('utf-8')) # Ajax的
ajax_url = 'http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=%E5%9B%BE%E7%89%87&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=&copyright=&word=%E5%9B%BE%E7%89%87&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=&fr=&expermode=&force=&pn=30&rn=30&gsm=1e&1546957772498='
http = urllib3.PoolManager()
res = http.request('get',ajax_url)
# print(res.data.decode())
img_urls = re.findall(r'"thumbURL":"(.*?),',res.data.decode())
# print(img_urls)
# print(len(img_url))
headers = {
'Referer':'https://www.baidu.com/s?ie=utf-8&wd=%E5%9B%BE%E7%89%87'
}
for i , img_url in enumerate(img_urls):
# print(img_url)
img = http.request('get',img_url,headers=headers)

最新文章

  1. HTML5学习总结——canvas绘制象棋(canvas绘图)
  2. array
  3. preload pic
  4. JAVA编写WEB服务器
  5. Subclasses
  6. Web开发知识点总结
  7. 测试Flask+PYTHON的WEB框架
  8. jquery设置文本框值 与获取文本框的值
  9. python之字典、列表、元组生成器的使用
  10. [Swift]LeetCode145. 二叉树的后序遍历 | Binary Tree Postorder Traversal
  11. idea构建spark开发环境,并本地运行wordcount
  12. angular监听dom渲染完成,判断ng-repeat循环完成
  13. js监听全屏的事件
  14. 【java】解析java网络
  15. Docker Engine SDKs and API 的开发2
  16. 国外(英文)——WPF较好的奇葩问题解决网站
  17. SpringMVC-DispatcherServlet配置(Spring-servlet.xml)
  18. WPF 从文件加载字体
  19. Scrum 5.0(继4.0)
  20. 【POJ】3270.Cow Sorting

热门文章

  1. Android瀑布流优化,解决Recyclerview展示大批量图片时Item自动切换、闪烁、空白等问题
  2. Url解码和编码 escape()、encodeURI()、encodeURIComponent()区别详解
  3. 【翻译】关于vertical-align所有你需要知道的
  4. Struts2框架中使用Servlet的API示例
  5. 断路器Feign
  6. Python之函数(自定义函数,内置函数,装饰器,迭代器,生成器)
  7. LeetCode(82):删除排序链表中的重复元素 II
  8. vue 的动画
  9. C++ 关闭显示器
  10. shiro 单点登录原理 实例