python爬虫拉钩网:{'msg': '您操作太频繁,请稍后再访问', 'clientIp': '113.57.176.181', 'success': False}
2024-09-03 09:28:49
反爬第一课:
在打印html.text的时候总会提示
{'success': False, 'msg': '您操作太频繁,请稍后再访问', 'clientIp': '113.14.1.254'}
需要加header,请求头,用来模拟用户登陆。
至少需要这三个信息,否则都有可能出现问题。
header={
# 用于告诉服务器我是从哪个页面链接过来的,服务器基此可以获得一些信息用于处理。如果不加入,服务器可能依旧会判断为非法请求
'Referer':'XXXX',
# User-Agent(UA) 服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。也就是说伪装成浏览器进行访问
'User-Agent':'XXX'}
原链接:https://blog.csdn.net/doubledog1112/article/details/79223039
最新文章
- angular-JS模仿Form表单提交
- [LeetCode] Power of Three 判断3的次方数
- php上传绕过
- C# 线程同步
- object-c面向对象2
- Linux 调节屏幕亮度
- Poj/OpenJudge 1042 Gone Fishing
- Android开发UI之去掉title bar
- OUTPUT、Merge语句的使用
- 虾米loop 摇头代码
- DDD理论学习系列(13)-- 模块
- mysql5.6默认情况下内存占用太大
- Android UI性能优化实战 识别绘制中的性能问题
- Unity资源内存管理--webstream控制
- c语言cJson数组生成与解析
- JS window与document
- [转]openstack-kilo--issue(十四)Tunnel IP %(ip)s in use with host %(host)s'
- MVC 的那点小事
- 提高Android和iOS调试编译速度
- webSQL 增删改查