风雨之后是彩虹,经历了三个月的风雨之后,从6月14日起(上次故障发生于6月13日)开始享受彩虹。。。而今天突袭而来的RDS故障让我们懂得了彩虹期间会有阵雨,但不管怎么样,离“晴空万里”越来越近了。

2013年7月23日10:00~11:00左右,我们使用的阿里云RDS(关系型数据库服务)突然出现故障,造成了网站不能访问(大家访问时遇到的502错误就是故障的表现)。由此给大家带来了很大的麻烦,我们深表歉意!望大家谅解!

这次502故障发生时,我们先从服务器上的错误日志下手,一下子将故障的引发点逮个正着:

System.Data.SqlClient.SqlException (0x80131904): 在从服务器接收结果时发生传输级错误。 (provider: TCP Provider, error: 0 - 远程主机强迫关闭了一个现有的连接。)

数据库连接被强制关闭,那问题肯定与RDS有关。

10:05联系阿里云客户经理,10:06提交工单。。。

接着,通过telnet至RDS的端口确认是不是网络问题引起的,telnet正常连接,说明网络没问题,问题在RDS本身。

接下来就是阿里云的工程师在忙,我们只能紧张而焦急地等待。。。

11:00左右,RDS切换至镜像节点(RDS做了数据库镜像)之后,网站立即恢复正常。

对于故障的真正原因,阿里云工程师接下来会进行全面的分析。多希望有一天阿里云能像Amazon一样,将每次故障的原因及处理情况对外公开。

就这样经历了一场云上的阵雨,有人在微博上说我们是阿里云踩坑大师,我们希望踩一个少一个,同时希望阿里云找出所有的坑一个一个填平,只要有坑,总会被人踩着的。

最新文章

  1. Windows Azure Storage (20) 使用Azure File实现共享文件夹
  2. MyBatis的初始化方式
  3. set JAVA_HOME in RHEL/CentOS
  4. DataSanp的控制老大-DSServer
  5. Android用路径api在内部存储读写文件
  6. LINUX HA:Pacemaker + Corosync初配成功
  7. [Python学习笔记][第四章Python字符串]
  8. Tomcat access log配置
  9. 深入以太坊智能合约 ABI
  10. Docker & ASP.NET Core (3):发布镜像
  11. python3 re模块正则匹配字符串中的时间信息
  12. 【python小练】0002
  13. webpack学习笔记--其它配置项
  14. Python一行代码处理地理围栏
  15. go get fatal: could not read Username for 'https://code.xxx.org': terminal prompts disabled
  16. 哈密顿绕行世界问题 (dfs)
  17. Tomcat启动时卡在 INFO HostConfig.deployDirectory Deploy
  18. 【题解】Luogu P4344 [SHOI2015]脑洞治疗仪
  19. Tidb进行缩减扩容tikv节点
  20. 2018.09.20 atcoder 1D Reversi(模拟)

热门文章

  1. 取消SecureCRT的右击粘贴功能
  2. 【SQL】使用调用层接口
  3. Selenium2+python自动化43-判断title(title_is)【转载】
  4. eclispe新导入的文件有个小红叉号(x)的问题
  5. 洛谷 P1093 奖学金【三级结构体排序】
  6. Educational Codeforces Round 30 B【前缀和+思维/经典原题】
  7. HDU 2553 N皇后问题【棋盘型DFS】
  8. golang笔记:cookie
  9. centos7下配置samba,win10访问
  10. CentOS7部署l2tp/IPsec服务