这次爬取的目标是:美桌网首页 > 桌面壁纸 > 卡通动漫 类别下的壁纸.

我们先随机选取一个专辑来爬(http://www.win4000.com/wallpaper_detail_54520.html ).

后面再把整个卡通动漫类别的所有专辑的壁纸爬下来。

代码如下:

import requests
from bs4 import BeautifulSoup
import os #爬取的网站:http://www.win4000.com/wallpaper_detail_54520.html def Get_image_url(url):
#传入页面的URL,得到所有图片所在的标签和图册的名字,并返回 Res = requests.get(url)
Soup = BeautifulSoup(Res.text,'lxml') Name = Soup.select('h1')[0].string
Tag = 'img[title=\"' + Name + '\"]'
Image = Soup.select(Tag) return Image,Name def Download_Image(Image_url):
#传入图片的URL,将图片保存在本地
Image = requests.get(Image_url,stream=True)
#将链接的最后一个字符串最为图片的名字
name = Image_url.split('/')[-1]
#保存图片
with open(name,'wb') as f:
f.write(Image.content) def main():
#主调函数
url = "http://www.win4000.com/wallpaper_detail_54520.html"
[Image,Name] = Get_image_url(url)
#print(Name,Image)
#保存当前目录
path = os.getcwd()
#创建保存图片的目录
os.mkdir(Name)
os.chdir(path + '/' + Name)
for I in Image:
Download_Image(I['src'])
#返回之前的目录
os.chdir(path)
if __name__ == '__main__':
main()

注:如果是Windows下,将进入文件夹的命令 [ os.chdir(path + '/' + Name)  ] 改为:os.chdir(path + '\\' + Name)

最新文章

  1. log4j 不同模块输出到不同的文件
  2. log4net不同logger输出日志
  3. [转]Git调用第三方对比工具beyondCompare
  4. 【转】对 Xcode 菜单选项的详细探索(干货)
  5. javascript 模式方面的学习
  6. OC - 2.OC基础知识介绍
  7. CCHttpClient发起https请求
  8. Windows7 IIS7 无法启动计算机上的服务W3SVC如何修复
  9. Apache、php、mysql单独安装配置
  10. Codeforces Round #372 (Div. 2) C 数学
  11. leetcode-006 detect cycle
  12. 进入PE后不显示硬盘的解决办法
  13. java并发之Semaphore
  14. changXY
  15. BootStrap格栅系统
  16. Scrum的3种角色划分--2048小游戏
  17. for循环中let与var的区别,块级作用域如何产生与迭代中变量i如何记忆上一步的猜想
  18. 【配置详解】Quartz配置文件详解
  19. 使用jquery-form进行文件上传
  20. jQuery插件实例七:一棵Tree的生成史

热门文章

  1. MySQL 8 服务器组件
  2. 什么是json? 什么是xml?JSON与XML的区别比较
  3. jvm编译器的优化
  4. 判断合同金额是否可以转整形和sql语句中添加条件语句
  5. 《NVM-Express-1_4-2019.06.10-Ratified》学习笔记(6.5-加-8.2-加-8.3)End-to-end_Data_Protection
  6. C语言 三目运算
  7. c语言中 char* 和 unsigned char* 的区别浅析(转)
  8. UML 建模 -- 基础知识
  9. 为什么要使用Redis? —— Redis实战经验
  10. golang channel 的一次内存错误