用python正则表达式提取网页的url

 import re

 import urllib

 url="http://www.itokit.com"

 s=urllib.urlopen(url).read()

 ss=s.replace(" ","")

 urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)

 for i in urls:

 print i

 else:

 print 'this is over'

挺好用的，记录下

巴特西

用python正则表达式提取网页的url

最新文章

热门文章