一个爬取lativ诚衣网站上模特穿搭图片的爬虫
2024-10-21 23:05:48
show the code:
[peter@localhost savvy]$ vi lativ.py
# -*- coding:utf-8 -*-
import requests,lxml,os
from bs4 import BeautifulSoup as sb def get_html():
url = 'https://www.lativ.com/Style'
headers = {'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.76 Mobile Safari/537.36'}
html = requests.post(url,headers).text
return html def soup_html(html):
soup = sb(html, 'lxml')
a = soup.find_all('a')[12:190]
return a def save_img(a):
for i in a:
l = i.get('href')
print l
j = l[-14:-9]
with open(str(j)+'.jpg','wrb') as f:
img = requests.get(l)
f.write(img.content)
print str(j)+'saved' if __name__=='__main__':
html = get_html()
a = soup_html(html)
save_img(a)
最新文章
- 块级标签包含行内标签底部出现3px间隔的解决办法
- Touch ID使用
- 分布式环境下rabbitmq发布与订阅端
- Oracle常用命令
- PHP表单验证
- 判断listview是上滑还是下滑的方法
- EDIUS设置自定义输出的方法
- ***用php的strpos() 函数判断字符串中是否包含某字符串的方法
- linux命令 cp 递归复制 带权限复制
- HTML语义化标签(二)
- C++11 virtual函数学习笔记
- 福科田led漫反射灯条生产工序
- 201521123033《Java程序设计》第5周学习总结
- EF的应用
- sunTime
- 学习笔记49—matlab FDR校正
- android显示通知栏Notification以及自定义Notification的View
- 英国BBC出的这套中国风海报,设计美哭了!
- Flink官网文档翻译
- mysql概要(四)order by ,limit ,group by和聚合函数的特点,子查询
热门文章
- 模拟 2015百度之星资格赛 1003 IP聚合
- adb shell报错:error: insufficient permissions for device的解决办法
- Pycharm中pygame报错
- 百度地图API简单初始化
- php 使用serialize() 和 unserialize() 让对象成超级变量
- sql server的一个字符串分割的表值函数方法
- 解决Eclipse自动补全变量名的问题
- 【转】彻底解析Android缓存机制——LruCache
- js获取服务器生成并返回客户端呈现给客户的控件id的方法
- Java遍历HashMap并修改(remove)