抓取万水书苑网页中所有<a>标签中的超链接井显示。
import requests
from bs4 import BeautifulSoup url = 'http://www.wsbookshow.com/'
html = requests.get(url)
html.encoding="gbk" sp=BeautifulSoup(html.text,"html.parser")
links=sp.find_all(["a","img"]) # 同时读取 <a> 和 <img>
for link in links:
href=link.get("href") # 读取 href 属性的值
# 判断值是否为非 None,以及是不是以http://开头
if(href != None)and(href.startswith("http://")):
print(href)

最新文章

  1. blktrace
  2. apache2.4以上版本配置虚拟主机
  3. Postgresql存储过程调试:PostgreSQL 之 Function NOTICE
  4. Chrome插件概览(一) – The basics
  5. css 妙味 总结
  6. ArcGIS Server,4000端口被占用
  7. 彻底弄懂css中单位px和em,rem的区别 转的自己看
  8. volatile synschonized的区别
  9. Install GDAL in OpenSUSE 12.3 Linux
  10. 关于Session
  11. 获取bing图片并自动设置为电脑桌面背景(C++完整开源程序)
  12. Android下资源使用的方式-android学习之旅(五十三)
  13. Can peel peel solve pesticide problem
  14. Flask框架里的cookie和session
  15. linux添加zabbix service并开机自动启动
  16. android iOS 编码问题害死人!
  17. [linux] ssh远程执行本地脚本
  18. 微信小程序使用函数的三种方法
  19. pku 2284 That Nice Euler Circuit
  20. centos下搭建高可用redis

热门文章

  1. Json返回结果为null属性不显示解决
  2. AttributeError: module &#39;selenium.webdriver.common.service&#39; has no attribute &#39;Service&#39;
  3. 干货 | 京东云应用负载均衡(ALB)多功能实操
  4. 01 语言基础+高级:1-8 File类与IO流_day10【缓冲流、转换流、序列化流】
  5. deque &amp; list
  6. 【hdu6613】Squrirrel 树形DP
  7. Bless All
  8. [AC自动机]玄武密码
  9. Python笔记_第三篇_面向对象_3.重载(overloading)和重写(overriding)
  10. Hard Disk Driver(GPT)