用python正则表达式提取网页的url
2024-10-01 19:24:37
import re
import urllib
url="http://www.itokit.com"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)
for i in urls:
print i
else:
print 'this is over'
挺好用的,记录下
最新文章
- redis学习教程之一基本命令
- Code! MVC 5 App with Facebook, Twitter, LinkedIn and Google OAuth2 Sign-on (C#)
- jquery eq 用法
- 【转】【MMX】 基于MMX指令集的程序设计简介
- SignalR记录
- API指南----application
- NAVICATE 修改存储过程提示PROCEDURE _Navicat_Temp_Stored_Proc already exists 解决方法
- 前端MVVM学习之KnockOut(二)
- Kubernetes日志收集
- javaSE_05Java中方法(函数)与重载、递归-思维导图
- eclipse 设置 默认编码为 utf-8
- ES 入门之一 安装ElasticSearcha
- Spring揭秘 读书笔记 三 bean的scope与FactoryBean
- 0. Java虚拟机系列备忘预览图
- ScheduledThreadPoolExecutor Usage
- (62)Wangdao.com第十天_JavaScript 变量的作用域
- 20165231 2017-2018-2《Java程序设计》课程总结
- 洛谷 P1069 细胞分裂 解题报告
- 第一次登录mysql,使用任何命令都报错ERROR 1820 (HY000): You must reset your password using ALTER USER statement before executing this statement.
- WC游记