今天上午 10: 40 左右,我们所使用的阿里云 RDS 实例的 CPU 突然飙高到近 100% ,造成大量数据库查询操作缓慢、超时,在这个恶劣条件下大量 memcached 缓存无法建立,这样的雪上加霜让 Web 服务器的 CPU 跟着不堪重负,于是要么访问缓慢,要么直接 503 。。。造成网站无法正常访问,由此给您带来了很大的麻烦,请您谅解。

问题非常奇怪,昨天同样的时间段,RDS CPU 占用却少很多,平时 RDS CPU 的占用通常都在 60% 以下,而今天我们网站的访问量并没有明显的突增。

面对这个突发故障,我们实在找不出可能的线索。在前几年使用阿里云 RDS 曾经遇到过很少几次类似数据库访问突发缓慢的问题,当时都通过主备切换神奇地解决了。这次,我们最终还是采用了主备切换的方法,在 11:20 左右启动了主备切换。

主备切换后,CPU 很快就降了下来,但由于 SQL Server 预热需要一定的时间(建立缓存),所以在切换后的一段时间,访问网站依然缓慢,直到 11:40 左右才恢复正常。

我们所使用的 RDS 实例规格是 SQL Server 2008 R2 ,20核CPU ,12G内存,6000 IOPS ,一直没有升级到 Server Server 2012 或 2016 ,就是因为阿里云只有 2008 R2 才提供了高可用版(支持主备切换),而 2012 与 2016 只有基础版。而使用高可用版,在出现突发故障进行主备切换是一个简单有效的方式。

最新文章

  1. (转)如何处理iOS中照片的方向
  2. Android进程间的通信之Messenger
  3. js onclick="return test()"事件返回值,对有些事件,会影响默认动作的执行。如:onclick和onsubmit
  4. openJudge计算概论-谁考了第k名
  5. [原]sdut2605 A^X mod P 山东省第四届ACM省赛(打表,快速幂模思想,哈希)
  6. 【转载】VGA时序与原理
  7. Lessons learned from manually classifying CIFAR-10
  8. POJ 2186
  9. Keil MDK Code、RO-data、RW-data、ZI-data数据段
  10. PHP基本语法的小结
  11. 判断对象是不是Vector
  12. c 判断水仙花数,质数(素数)
  13. ASP.NET Zero--3.菜单配置
  14. SQL常用命令
  15. JavaScript中事件
  16. Python调用ansible API系列(三)带有callback的执行adhoc和playbook
  17. mybatis整合hikariCP(非spring)
  18. C#文件流的读写
  19. DBN 大作业
  20. linux开机启动详细流程图

热门文章

  1. js 继承的简单易懂小例子
  2. Loadrunner 读取文件
  3. Java后台实现方法
  4. 豌豆夹Redis解决方式Codis源代码剖析:Proxy代理
  5. mysql新建数据库,并设置charset为utf8,使用utf8_general_ci字符集校验结果
  6. MVC+EF 入门教程(四)
  7. Struts配置详解
  8. 【批处理】IF ERRORLEVER语句顺序注意
  9. iOS开发--SQLite重要框架FMDB的使用
  10. PXE搭建