爬虫学习--Day4(小猿圈爬虫开发_2)
2024-10-19 22:24:03
requests模块
- urllib模块
- requests模块 requests模块:python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高。
作用:模拟浏览器发送请求。 如何使用:(requests模块的编码流程)
- 指定url
- 发起请求
- 获取响应数据
- 持久化存储 环境的安装:
pip install requests 实战编码:
- 需求:爬取搜狗首页页面的数据
# coding=gbk
#Created on 2019/7/7
#@author: XiaoHu # 需求:爬取搜狗首页的页面数据
import requests
if __name__ == "__main__":
#step_1 指定url
url = 'https://www.sogo.com/'
#step_2 发起请求
#get方法会返回一个响应对象
response=requests.get(url=url)
#step_3 获取响应数据.text返回的是字符串形式的响应数据
page_text=response.text
print(page_text)
#step_4 持久化存储
with open('./sogo.html','w',encoding='utf-8') as fp:
fp.write(page_text)
print('爬取数据结束!!!!!!')
最新文章
- div+css:div中图片垂直居中
- ASP.NET Web.config
- ReportDesigner中实现保存,保存所有,注册ICommandHandler方式实现
- BFC and Haslayout
- Linux由管道组成的值得学习的命令
- Sqlserver_In、exists使用
- 【POJ 1988】 Cube Stacking (带权并查集)
- 关于HTTP请求报文和响应报文学习笔记
- D3画图学习一
- #ifndef #define #endif 的用法
- 什么是JSONP以及它是怎么产生的
- C#中打日志导出日志到txt文本
- Android中PropertyAnimation属性动画详解(一)
- git 命令使用集锦
- 剑指Offer 7. 斐波那契数列 (递归)
- Python3基础 str + 字符串变量拼接
- 如何使用 python3 将RGB 图片转换为 灰度图
- nagios client 端的安装配置 以及 svr端对应的配置(转)
- linux Posix 信号量 二
- (转)Python3 日期和时间
热门文章
- 记录 java 安卓 各类引用包报错处理方法 例如 android.support.v4.app.+ ,io.reactivex.+
- DG常用运维命令及常见问题解决
- Three Key Points of Success 成功三要素
- DCL语句
- 程序员需要了解的硬核知识之CPU
- 什么是STM32的ISP?
- Java学习笔记之方法
- HTML5远程工具
- [BZOJ1965][AHOI2005] 洗牌 - 扩展欧几里得
- Centos 7 集成安装Apache+PHP+Kerberos+LDAP+phpLDAPadmin