在编写爬虫进行网页数据的时候,大多数情况下,需要在请求是增加请求头

python下非常好用的伪装请求头的库:fake-useragent,具体使用说明如下:

  • 安装fake-useragent库

pip install fake-useragent

  • 获取各浏览器的fake-useragent

from fake_useragent import UserAgent
ua = UserAgent()
#ie浏览器的user agent
print(ua.ie) #opera浏览器
print(ua.opera) #chrome浏览器
print(ua.chrome) #firefox浏览器
print(ua.firefox) #safri浏览器
print(ua.safari) #最常用的方式
#写爬虫最实用的是可以随意变换headers,一定要有随机性。支持随机生成请求头
print(ua.random)
print(ua.random)
print(ua.random)

示例代码

from fake_useragent import UserAgent
import requests
ua=UserAgent()
#请求的网址
url="http://www.baidu.com"
#请求头
headers={"User-Agent":ua.random}
#请求网址
response=requests.get(url=url,headers=headers)
#响应体内容
print(response.text)
#响应状态信息
print(response.status_code)
#响应头信息
print(response.headers)

最新文章

  1. MVC实用架构设计(三)——EF-Code First(3):使用T4模板生成相似代码
  2. 非常简单的升级phpnow自带的php版本到5.3的方法
  3. webbench之使用(二)
  4. Linux下GitLab的快速安装以及备份
  5. 编写NPAPI plugin的命名问题
  6. Bootstrap的优先级、选择器、伪类
  7. tomcat 配置
  8. Uva 10129 - Play on Words 单词接龙 欧拉道路应用
  9. wdcp日志
  10. 利用用户自己的server、tomcat下的解决iOS7.1企业应用无法安装应用程序 由于证书无效的问题
  11. Linux 系统级开启文件句柄 调优
  12. #6 Python数据类型及运算
  13. (转)Java transient关键字使用小记
  14. hadoop Mapreduce组件介绍
  15. python练习题,写一个方法 传进去列表和预期的value 求出所有变量得取值可能性(例如list为[1,2,3,4,5,6,12,19],value为20,结果是19+1==20只有一种可能性),要求时间复杂度为O(n)
  16. chown命令详情
  17. 触发器的SQL语法
  18. C语言:将结构体数组的成绩按照从小到大进行排序。
  19. 可怕的npm蠕虫
  20. CodeForces 811C Vladik and Memorable Trip

热门文章

  1. 数组/字符串/ Math / 方法示例
  2. php钩子技术
  3. ThinkPHP RBAC权限管理机制
  4. Python序列——元组
  5. 基于BASYS2的VHDL程序——数字钟(改进版)
  6. Python ip与数字的转换方式
  7. python BaseManager分布式学习
  8. 获取当前正在运行的activity
  9. mysql函数之九:MySql取得日期(前一天、某一天)
  10. CodeForces 1091G. New Year and the Factorisation Collaboration