用python简单爬取一个网页
2024-10-09 06:52:33
1打开编辑器
2撸几行代码
import urllib.request import urllib.error def main(): askURl("http://movie.douban.com/top250?start") #URL的网页内容
def askURl(url): head = {
"User-Agent": "Mozilla/5.0(Windows NT 10.0;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 80.0.3987.122Safari / 537.36"
}
#head伪装一下 告诉机器 request = urllib.request.Request(url,headers=head)
html = ""
try:
response = urllib.request.urlopen(request)
html = response.read().decode("utf-8")
print(html)
except urllib.error.URLError as e:
if hasattr(e,"code"):
print(e.code)
if hasattr(e,"reason"):
print(e.reason) if __name__ == '__main__':
#调用函数
main()
最新文章
- UIDatePicker 日期/时间选取器(滚轮)—IOS开发
- DWR的Reverse Ajax技术实现
- MYSQL远程登录权限设置(转)
- 关于gzip压缩
- COJ 2105 submatrix
- Linux 统计代码行数命令
- Co-prime Array&;&;Seating On Bus(两道水题)
- libev源代码浅析
- [转]整理jquery使用好习惯
- solr query的post方式
- vue 移动端公众号采坑经验
- EPPlusHelper
- express搭建服务器
- vue-awesome-swiper组件不能自动播放和导航器小圆点不显示问题
- item 5: 比起显式的类型声明,更偏爱auto
- Oracle DBA神器之Toad
- Qt5+VS2010的安装及使用
- 利用pt-table-checksum校验数据一致性
- 深入理解Spring系列之十二:@Transactional是如何工作的
- 启动tomcat时为tomcat指定JDK