Python之爬虫-校花网

#!/usr/bin/env python
# -*- coding:utf-8 -*- import re
import requests # 拿到校花网主页的内容
response = requests.get('http://www.xiaohuar.com/')
data = response.text # 拿到校花网所有的图片链接
results = re.findall('lazysrc="(.*?)"', data)
for result in results: # type:str # 判断是不是有链接的
if result.startswith('htt'):
pass
else:
img_result = 'http://www.xiaohuar.com/' + result # 获取图片内容
img_response = requests.get(img_result)
img_data = img_response.content
img_name = result.split('/')[3]
img_filename = img_name + '.jpg'
print(img_filename) # 保存图片内容
with open(img_filename, 'wb') as f: # write,read,wb是写入二进制
f.write(img_data)
print('爬取成功一张')

最新文章

  1. 关于handler 和 looper 的问题
  2. DAY6 使用ping钥匙临时开启SSH:22端口,实现远程安全SSH登录管理就这么简单
  3. 自定义控件EditText
  4. HTTP通信过程底层实现原理
  5. unity3d Aniso Level 摄像机近地面清楚,远地面模糊
  6. JS时间戳格式化日期时间 由于mysql数据库里面存储时间存的是时间戳,取出来之后,JS要格式化一下显示。
  7. springaop实现登陆验证
  8. asp.net 框架初接触
  9. 使用Pig预测电信用户的移动路径
  10. [AngularJS + Webpack] Uglifying your JavaScript
  11. linux管理员切换与管理员密码第一次设置
  12. 字符串经典的hash算法
  13. js中的总结汇总(以后的都收集到这篇)
  14. MAC使用小技巧(二)
  15. 算法竞赛入门经典 习题2-10 排列(permutation)
  16. zookeeper工作机制
  17. 魅族5.0以上设备(亲测有效)激活Xposed框架的流程
  18. 【MyBatis】Mapper XML 文件
  19. 剖析项目多个logback配置(下)
  20. flink Standalone Cluster

热门文章

  1. 用 Python 批量下载百度图片
  2. angularjs事件通信$on,$emit,$broadcast详解
  3. 新安装ubuntu系统的简单优化
  4. 可迭代对象(__iter__()和__next__())
  5. WPF 解决多个TreeViewItem同时触发某事件的简单方法
  6. 愉快地使用Groovy Shell
  7. 动态SQL屏幕条件选择(里面还有赋值的新语法)
  8. springBoot 集成Mysql数据库
  9. 并发—JVM内部机制和外部机制处理方法
  10. 高版本 MySQL 导出的脚本到低版本 MySQL 中执行时报错