Python之爬虫-校花网
2024-10-19 14:34:56
Python之爬虫-校花网
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import re
import requests
# 拿到校花网主页的内容
response = requests.get('http://www.xiaohuar.com/')
data = response.text
# 拿到校花网所有的图片链接
results = re.findall('lazysrc="(.*?)"', data)
for result in results: # type:str
# 判断是不是有链接的
if result.startswith('htt'):
pass
else:
img_result = 'http://www.xiaohuar.com/' + result
# 获取图片内容
img_response = requests.get(img_result)
img_data = img_response.content
img_name = result.split('/')[3]
img_filename = img_name + '.jpg'
print(img_filename)
# 保存图片内容
with open(img_filename, 'wb') as f: # write,read,wb是写入二进制
f.write(img_data)
print('爬取成功一张')
最新文章
- 关于handler 和 looper 的问题
- DAY6 使用ping钥匙临时开启SSH:22端口,实现远程安全SSH登录管理就这么简单
- 自定义控件EditText
- HTTP通信过程底层实现原理
- unity3d Aniso Level 摄像机近地面清楚,远地面模糊
- JS时间戳格式化日期时间 由于mysql数据库里面存储时间存的是时间戳,取出来之后,JS要格式化一下显示。
- springaop实现登陆验证
- asp.net 框架初接触
- 使用Pig预测电信用户的移动路径
- [AngularJS + Webpack] Uglifying your JavaScript
- linux管理员切换与管理员密码第一次设置
- 字符串经典的hash算法
- js中的总结汇总(以后的都收集到这篇)
- MAC使用小技巧(二)
- 算法竞赛入门经典 习题2-10 排列(permutation)
- zookeeper工作机制
- 魅族5.0以上设备(亲测有效)激活Xposed框架的流程
- 【MyBatis】Mapper XML 文件
- 剖析项目多个logback配置(下)
- flink Standalone Cluster
热门文章
- 用 Python 批量下载百度图片
- angularjs事件通信$on,$emit,$broadcast详解
- 新安装ubuntu系统的简单优化
- 可迭代对象(__iter__()和__next__())
- WPF 解决多个TreeViewItem同时触发某事件的简单方法
- 愉快地使用Groovy Shell
- 动态SQL屏幕条件选择(里面还有赋值的新语法)
- springBoot 集成Mysql数据库
- 并发—JVM内部机制和外部机制处理方法
- 高版本 MySQL 导出的脚本到低版本 MySQL 中执行时报错