requests模块
- urllib模块
- requests模块 requests模块:python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高。
作用:模拟浏览器发送请求。 如何使用:(requests模块的编码流程)
- 指定url
- 发起请求
- 获取响应数据
- 持久化存储 环境的安装:
pip install requests 实战编码:
- 需求:爬取搜狗首页页面的数据
 # coding=gbk
#Created on 2019/7/7
#@author: XiaoHu # 需求:爬取搜狗首页的页面数据
import requests
if __name__ == "__main__":
#step_1 指定url
url = 'https://www.sogo.com/'
#step_2 发起请求
#get方法会返回一个响应对象
response=requests.get(url=url)
#step_3 获取响应数据.text返回的是字符串形式的响应数据
page_text=response.text
print(page_text)
#step_4 持久化存储
with open('./sogo.html','w',encoding='utf-8') as fp:
fp.write(page_text)
print('爬取数据结束!!!!!!')
												

最新文章

  1. div+css:div中图片垂直居中
  2. ASP.NET Web.config
  3. ReportDesigner中实现保存,保存所有,注册ICommandHandler方式实现
  4. BFC and Haslayout
  5. Linux由管道组成的值得学习的命令
  6. Sqlserver_In、exists使用
  7. 【POJ 1988】 Cube Stacking (带权并查集)
  8. 关于HTTP请求报文和响应报文学习笔记
  9. D3画图学习一
  10. #ifndef #define #endif 的用法
  11. 什么是JSONP以及它是怎么产生的
  12. C#中打日志导出日志到txt文本
  13. Android中PropertyAnimation属性动画详解(一)
  14. git 命令使用集锦
  15. 剑指Offer 7. 斐波那契数列 (递归)
  16. Python3基础 str + 字符串变量拼接
  17. 如何使用 python3 将RGB 图片转换为 灰度图
  18. nagios client 端的安装配置 以及 svr端对应的配置(转)
  19. linux Posix 信号量 二
  20. (转)Python3 日期和时间

热门文章

  1. 记录 java 安卓 各类引用包报错处理方法 例如 android.support.v4.app.+ ,io.reactivex.+
  2. DG常用运维命令及常见问题解决
  3. Three Key Points of Success 成功三要素
  4. DCL语句
  5. 程序员需要了解的硬核知识之CPU
  6. 什么是STM32的ISP?
  7. Java学习笔记之方法
  8. HTML5远程工具
  9. [BZOJ1965][AHOI2005] 洗牌 - 扩展欧几里得
  10. Centos 7 集成安装Apache+PHP+Kerberos+LDAP+phpLDAPadmin