python3爬取高清壁纸(1)
2024-09-06 08:58:54
这次爬取的目标是:美桌网首页 > 桌面壁纸 > 卡通动漫 类别下的壁纸.
我们先随机选取一个专辑来爬(http://www.win4000.com/wallpaper_detail_54520.html ).
后面再把整个卡通动漫类别的所有专辑的壁纸爬下来。
代码如下:
import requests
from bs4 import BeautifulSoup
import os #爬取的网站:http://www.win4000.com/wallpaper_detail_54520.html def Get_image_url(url):
#传入页面的URL,得到所有图片所在的标签和图册的名字,并返回 Res = requests.get(url)
Soup = BeautifulSoup(Res.text,'lxml') Name = Soup.select('h1')[0].string
Tag = 'img[title=\"' + Name + '\"]'
Image = Soup.select(Tag) return Image,Name def Download_Image(Image_url):
#传入图片的URL,将图片保存在本地
Image = requests.get(Image_url,stream=True)
#将链接的最后一个字符串最为图片的名字
name = Image_url.split('/')[-1]
#保存图片
with open(name,'wb') as f:
f.write(Image.content) def main():
#主调函数
url = "http://www.win4000.com/wallpaper_detail_54520.html"
[Image,Name] = Get_image_url(url)
#print(Name,Image)
#保存当前目录
path = os.getcwd()
#创建保存图片的目录
os.mkdir(Name)
os.chdir(path + '/' + Name)
for I in Image:
Download_Image(I['src'])
#返回之前的目录
os.chdir(path)
if __name__ == '__main__':
main()
注:如果是Windows下,将进入文件夹的命令 [ os.chdir(path + '/' + Name) ] 改为:os.chdir(path + '\\' + Name)
最新文章
- log4j 不同模块输出到不同的文件
- log4net不同logger输出日志
- [转]Git调用第三方对比工具beyondCompare
- 【转】对 Xcode 菜单选项的详细探索(干货)
- javascript 模式方面的学习
- OC - 2.OC基础知识介绍
- CCHttpClient发起https请求
- Windows7 IIS7 无法启动计算机上的服务W3SVC如何修复
- Apache、php、mysql单独安装配置
- Codeforces Round #372 (Div. 2) C 数学
- leetcode-006 detect cycle
- 进入PE后不显示硬盘的解决办法
- java并发之Semaphore
- changXY
- BootStrap格栅系统
- Scrum的3种角色划分--2048小游戏
- for循环中let与var的区别,块级作用域如何产生与迭代中变量i如何记忆上一步的猜想
- 【配置详解】Quartz配置文件详解
- 使用jquery-form进行文件上传
- jQuery插件实例七:一棵Tree的生成史
热门文章
- MySQL 8 服务器组件
- 什么是json? 什么是xml?JSON与XML的区别比较
- jvm编译器的优化
- 判断合同金额是否可以转整形和sql语句中添加条件语句
- 《NVM-Express-1_4-2019.06.10-Ratified》学习笔记(6.5-加-8.2-加-8.3)End-to-end_Data_Protection
- C语言 三目运算
- c语言中 char* 和 unsigned char* 的区别浅析(转)
- UML 建模 -- 基础知识
- 为什么要使用Redis? —— Redis实战经验
- golang channel 的一次内存错误