问题描述:爬取京东的网站,爬取一段时间后报错。

经过一番查询,发现该错误是因为如下:

  1. http的连接数超过最大限制,默认的情况下连接是Keep-alive的,所以这就导致了服务器保持了太多连接而不能再新建连接。

  2. ip被封

  3. 程序请求速度过快。

解决办法如下:

第一种方法

try:
    page1 = requests.get(ap)
except requests.exceptions.ConnectionError:
    r.status_code = "Connection refused"

第二种方法:

request的连接数过多而导致Max retries exceeded

在header中不使用持久连接

'Connection': 'close'或requests.adapters.DEFAULT_RETRIES = 5

第三种方法:

针对请求请求速度过快导致程序报错。

解决方法可以参考以下例子:

import time

while 1:
    try:
        page = requests.get(url)
    except:
        print("Connection refused by the server..")
        print("Let me sleep for 5 seconds")
        print("ZZzzzz...")
        time.sleep(5)
        print("Was a nice sleep, now let me continue...")
        continue
http://www.chenxm.cc/post/536.html

原文地址:http://www.chenxm.cc/post/536.html

最新文章

  1. Java程序设计之算出一年第多少天
  2. adb connect 出现timeout的处理方式
  3. EntityFramwork入门
  4. 只有PD号的调起
  5. VB.NET的反射机制
  6. Java基础—ClassLoader的理解(转)
  7. Android:关于Edittext的一些设置
  8. MyBatis_延迟加载01
  9. 《转》xcode创建一个工程的多个taget,便于测试和发布多个版本
  10. VS2017 + QT5 + C++开发环境搭建和计算器Demo测试
  11. Spring Boot 中配置文件application.properties使用
  12. docker测试时候命令无法补全的解决方法_docker
  13. python-适配器模式
  14. 2018春招-今日头条笔试题-第三题(python)
  15. 【Unity】初始化物体的旋转角度
  16. [精]Odoo 8.0深入浅出开发教程-模块开发基础
  17. 在正文部分操作accordion内容展开和闭合
  18. elementUI 学习入门之 Button 按钮
  19. Hibernate One-to-One Mappings 一对一关系映射
  20. jsp之jstl核心标签库

热门文章

  1. 如何在 Linux 中找出 CPU 占用高的进程
  2. pos 访问超时 windows连接超时 497 天后未关闭 TIME_WAIT
  3. PWA 推送实践
  4. vue路由--命名视图
  5. 服务器字体导致NPE
  6. 实用,Windows后台守护进程iNeuDaemon发布。Linux操作系统下使用使用supervisor
  7. Qps从300到1500的优化过程
  8. GitLab Runner
  9. 关于使用kms时遇到的there is nothing to do here
  10. MySQL基础(5) | 存储过程