HTTPX是功能齐全的Python3的HTTP客户端,支持同步和异步API,支持HTTP/1.1 和 HTTP/2。

一般情况下,在爬取网页内容的时候,httpx 与 requests 的基本使用方法几乎是一模一样的。

比如:

import httpx

r = httpx.get('https://xxx.org/get')
print(r) # <Response [200 OK]>

但是在遇到有重定向的访问时,httpx.get() 和 requests.get() 访问结果却不相同。主要原因是两个库的参数设置有差别。

httpx,get() 有一个参数 follow_redirects= 默认值是 False;而 requests.get() 中的类似参数 allow_redirects= 的默认值是 True.

所以,对 requests 可以正常爬取,而 httpx 却返回 status_code=301 的任务,可以使用指定参数的办法来解决。

import httpx

r = httpx.get('https://xxx.org/get',follow_redirects=True)`

最新文章

  1. 数据结构图文解析之:AVL树详解及C++模板实现
  2. 大数据技术Hadoop入门理论系列之一----hadoop生态圈介绍
  3. AloneJs.msgbox() —— 弹出消息框
  4. hdu1047 Integer Inquiry
  5. 编译ffmpeg(iOS)
  6. 推荐第三方Oracle客户端查询工具
  7. 了解JVM运行时的内存分配
  8. 华硕ASUSPRO P5440UA笔记本电脑安装驱动
  9. Apache无法正常启动(配置多个监听端口)
  10. Oracle使用expdp/impdp导出导入数据
  11. 尚硅谷springboot学习1-简介
  12. 记一次autofac+dapper+mvc的框架搭建实践
  13. 【delphi】关键字详解
  14. 第212天:15种CSS居中的方式,最全了
  15. 移动 H5(PC Web)前端性能优化指南
  16. access数据库频繁读取操作会出现 System.Data.OleDb.OleDbException 的异常解决
  17. BeanShell Processor_使用Java处理脚本
  18. C++里创建 Trie字典树(中文词典)(一)(插入、遍历)
  19. HttpRunnerManager 接口自动化测试平台 搭建实践
  20. oracle 删除用户命令和部分表空间操作

热门文章

  1. 配置代码片段问题 Invalid characters in string. Control characters must be escaped.
  2. c# reflect里面的getValue()参数
  3. uml类间关系总结
  4. 监听 view 初始化时
  5. python multiprocessing多进程 cannot pickle &#39;_io.TextIOWrapper&#39; object
  6. python基础 补漏
  7. P标签内容过长以省略号代替
  8. 百度云+Zotero进行知识管理的方法
  9. 看K线学炒股(8.10)
  10. JAVA课程设计(附源码)