嵩天老师一直强调的通用代码框架,这个框架可以用在很多爬虫中用来获取HTML文本,并且它通过response.raise_for_status()方法判断返回的状态码是不是200,如果不是,就会引发HTTPError异常,然后通过try except的异常处理获取到异常,而apparent_encoding则可以使得返回的编码准确。这样一个简单的通用代码框架可以有效的处理访问处理时遇到的网络问题。

def get_page(url):
try:
res = requests.get(url,timeout=10)
res.raise_for_status()
res.encoding = res.apparent_encoding
return res.text
except:
print('错误')
return ''

参考:https://zhuanlan.zhihu.com/p/36478306

最新文章

  1. Servlet的生命周期+实现方式
  2. OpenCV计算点到直线的距离 数学法
  3. java提高篇(十八)-----数组之一:认识JAVA数组
  4. 使用Source Safe for SQL Server解决数据库版本管理问题(转载)
  5. hadoop运行原理之Job运行(二) Job提交及初始化
  6. 最新php环境搭建
  7. CentOS 7 下引导 Windows7 启动
  8. iq 格式分析
  9. postgresql 连接数
  10. java基础知识回顾之java Thread类--java线程实现常见的两种方式实现Runnable接口(二)
  11. Mysql 的函数
  12. bzoj1014
  13. SQL中使用的一些函数问题
  14. 【模拟】NEERC15 J Jump(2015-2016 ACM-ICPC)(Codeforces GYM 100851)
  15. mysql 创建数据库使用默认字符集(备忘)
  16. BZOJ 4260: Codechef REBXOR( trie )
  17. Python twisted article
  18. IAM
  19. Deep Mutual Learning
  20. adb 常用命令-转载

热门文章

  1. Docker 配置国内镜像
  2. Oracle数据库实验一建立数据库
  3. JS相关实训
  4. LeetCode初级算法--排序和搜索01:第一个错误的版本
  5. kaldi使用cvte模型进行语音识别
  6. NOMP矿池搭建
  7. 音视频入门-11-PNG文件格式详解
  8. Fiddler抓包和工作原理
  9. SpringBoot中如何优雅的读取yml配置文件?
  10. win7更新,360手机安装谷歌框架