from selenium import webdriver
import requests,os
from lxml import etree
from selenium.webdriver.chrome.options import Options
from urllib import request chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu') #跳过视图界面 pro = webdriver.Chrome(executable_path='./chromedriver.exe',options=chrome_options) url = "http://sc.chinaz.com/tupian/haiyangshengwutupian.html"
pro.get(url)
js = 'window.scrollTo(0,document.body.scrollHeight)'
pro.execute_script(js)
page_text = pro.page_source tree = etree.HTML(page_text)
url_img = tree.xpath('//div[@id="container"]/div[@class="box picblock col3 masonry-brick"]/div/a/img/@src') #获取图片url列表
names = tree.xpath('//div[@id="container"]/div[@class="box picblock col3 masonry-brick"]/div/a/@alt') #图片名称列表 if not os.path.exists('./img'): #生成文件夹
os.mkdir('./img')
for index,url in enumerate(url_img):
img_path = './img/' + names[index]+'.jpg' #提取图片名称
request.urlretrieve(url,img_path)

  

最新文章

  1. DTO – 服务实现中的核心数据
  2. git 查看某文件的修改历史
  3. QTreeWidget创建
  4. 清除mac os svn密码命令行缓存
  5. checkbox判断选中
  6. URAL 1072 Routing(最短路)
  7. hibernate添加spring 事务管理注意问题记录
  8. 设计模式 --> (15)职责链模式
  9. ubuntu1604使用源码方式安装ruby2.5.0
  10. SQL反模式学习笔记4 建立主键规范【需要ID】
  11. 计算机图形学----基于3D图形开发技术 (韩正贤 著)
  12. Android取得系统时间
  13. 初次接触OSSEC
  14. PHP时间戳和日期转换
  15. 解决mybatis报错Result Maps collection does not contain value for java.lang.Integer
  16. mysql完整版
  17. ul>li中自定义属性后取值的问题
  18. Google maps API
  19. Delphi 设置时间格式
  20. Java设计模式(Design Patterns)——可复用面向对象软件的基础

热门文章

  1. Java基础---Java 开发工具IntelliJ IDEA 快捷操作
  2. 【C++札记】标准模板库string
  3. LC 3. Longest Substring Without Repeating Characters
  4. PHP之即点即改
  5. 一次腾讯云centos服务器被入侵的处理
  6. 解决IE8中select下拉列表文字上下不居中的问题
  7. Java 面向对象(七)多态
  8. 【Hibernate】入门
  9. 图解数据库中的各种 JOIN
  10. 通用mapper的增删改查方法 留存 备忘