爬取的网页链接为https://tieba.baidu.com/p/5177270774

是一个美女警花哦!

所用Python环境为:python 3.3.2   用到的库为:urllib.request    re

下面上代码:

import urllib.request
import re #获得url的html 源码格式,其中使用了一个通过修改User-Agent实现了隐藏
def open_url(url):
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')
page = urllib.request.urlopen(req)
html = page.read().decode('utf-8') #二进制的utf-8要解码得到html代码(Unicode)
return html #写正则表达式,获得html代码
def get_image(html):
p = r'<img class="BDE_Image" src="([^"]+\.jpg)"' #正则表达式 [^]中的^是取反的意思
temp = re.findall(p,html)
i = 0
page = 'C:/Users/lenovo/Desktop/mm/'
for each in temp:
i += 1
file = open(page+str(i)+'.jpg','wb')
each = urllib.request.urlopen(each).read() #将图片链接读出来写入文件中
file.write(each)
file.close() def main(url):
get_image(open_url(url)) #规定只有直接运行这个模块才能执行主程序
if __name__ == '__main__':
url = 'https://tieba.baidu.com/p/5177270774'
main(url)

下面是爬取结果:

当然,这个爬虫是不完善的,除了四张美女图片外还多了一些慕名奇妙的图片,但是总的来说还是爬到了美女的图片的。

最新文章

  1. CentOS 7.2安装docker-compose运行gitlib
  2. InvocationException: GraphViz&#39;s executables not found
  3. JAVA6开发WebService (二)——JAX-WS例子
  4. 在应用程序中实现对NandFlash的操作
  5. python+selenium环境配置(windows7环境)
  6. Android初学:联系创建Activity
  7. 为什么Myeclipse 提示Project &#39;bankmanager&#39; is missing required library,myeclipse项目上红叉 但内部红叉
  8. python(abi) RPM DEB Download
  9. ASP.NET 异步编程
  10. sprinfmvc学习--01
  11. Vultr\DigitalOcean\Linode速度最快的vps机房推荐
  12. GPRS的工作原理、主要特点
  13. 【javascript】函数中的this详解 — 大家准备好瓜子,我要讲故事啦~~
  14. lesson - 8 课程笔记 tar / gzip /bzip2 / xz /
  15. RedHat/Fedora/Centos 下bash 自动补全命令
  16. edit distance(编辑距离,两个字符串之间相似性的问题)
  17. js弹出层
  18. python glob 模块
  19. mysqli的使用
  20. 【转】Exchange Server 的防火墙开放端口

热门文章

  1. T100——程序从标准签出客制后注意r.c和r.l
  2. 浅谈后缀数组SA
  3. wpf 判断项目中的某个窗体是否已经打开或者已经存在
  4. 【原创】大叔经验分享(83)impala执行多个select distinct
  5. 初学java4 编译器优化
  6. springboot 集成 dubbo(一)简介
  7. 基于AccessToken方式实现API设计
  8. 关于一些JS的运算符
  9. 第五章、Django之模型层---单表操作
  10. [Abp vNext微服务实践] - 业务开发