爬虫学习之-requests乱码
2024-10-17 23:05:16
总体功能的一个演示
import requests response = requests.get("https://www.baidu.com")
print(type(response))
print(response.status_code)
print(type(response.text))
print(response.text)
print(response.cookies)
print(response.content)
print(response.content.decode("utf-8"))
我们可以看出response使用起来确实非常方便,这里有个问题需要注意一下:
很多情况下的网站如果直接response.text会出现乱码的问题,所以这个使用response.content
这样返回的数据格式其实是二进制格式,然后通过decode()转换为utf-8,这样就解决了通过response.text直接返回显示乱码的问题.
请求发出后,Requests 会基于 HTTP 头部对响应的编码作出有根据的推测。当你访问 response.text 之时,Requests 会使用其推测的文本编码。你可以找出 Requests 使用了什么编码,并且能够使用 response.encoding 属性来改变它.如:
response =requests.get("http://www.baidu.com")
response.encoding="utf-8"
print(response.text)
不管是通过response.content.decode("utf-8)的方式还是通过response.encoding="utf-8"的方式都可以避免乱码的问题发生
最新文章
- Java Class.cast方法
- vue.js 2.0开发(3)
- publish/subscribe
- 知方可补不足~sqlserver中使用sp_who查看sql的进程
- SqlServerException:拒绝对表对象的select,insert权限解决(新建账号导致的问题)
- Lnmp的安装、配置
- freefilesync 7 使用
- Storm系列(六)架构分析之Scheduler-调度器[EventScheduler]
- linux文件系统结构和权限
- VB.NET 数组的定义 动态使用 多维数组
- Oracle PL/SQL 游标
- [Android学习笔记]Activity
- 关于telnet协议的研究以及用java进行封装实现自己的telnet客户端(转)
- ASP.NET MVC4 微信公众号开发之网页授权(一):搭建基础环境
- $m$ 整除 $10^k$ 的一个充分条件
- Jekins学习
- Django REST framework之版本,解释器,序列化
- GSON中Java对象与JSON互相转换——(一)
- Python reverse
- Android -- ViewGroup源码分析+自定义