Cloud Alert 的部分应用部署在阿里云上,使用了多方面的监控服务:

  • 阿里自身的ECS服务器和网站。

  • Zabbix 监控服务器应用程序。

  • OneAPM 的应用级监控。

  • 腾讯云拨测,做网站监控。

腾讯云和阿里云的网站监控,总体来说腾讯云的云拨测告警延迟大一些。所以我们就强烈要求 Cloud Test 云测开发网站监控功能,这里就不打广告了。

使用过程中存在一些问题:

  • 监控工具多,告警不是很方面集中跟踪,所以需要集中告警平台。

  • 漏告警,深更半夜基本上很容易遗漏。阿里云监控告警仅告一次,不小心就漏了。毕竟不会挨个短信/邮件去跟踪。

Cloud Alert 自身就是集中告警云平台,所以我们自己就把阿里云告警和其他监控工具的接入进来,并且设置了告警自动升级策略,运维同学(也是开发)配置下短信、微信、电话、邮件通知。

  • 告警集中,目前支持了10多种方式:Zabbix 、Nagios 、Open-Falcon 、阿里云 、腾讯云、OneAPM 、监控宝、 vSphere 、 Solarwinds 、 Cacti 等工具。

  • 通知必达,个人和团队。支持微信、短信、电话、邮件等方式通知到人、如果没有人处理自动升级,总能找到人。解决漏告警问题。

接入阿里云监控很简单:

是通过在阿里云中配置Webhook URL的方式,将阿里云接入到Cloud Alert

1、进入Cloud Alert中点击集成-监控工具-阿里云

2、填写应用名称,点击保存生成appKey

3、将回调连接填写到阿里云控制台->云监控->报警服务->报警规则->修改页面,点击保存即可。

# URL格式

http://api.aiops.com/alert/api/event/aliyun/--/  --处填入您新建应用时生成的appkey

接下来设置下分派策略,这里设置了2个层次,一线有2人,一个组,以及一个轮流的排班,如果15分钟没有处理,会升级到2线。(测试环境)配置参考下方:

最后,设置下自己的通知方法,目前支持微信、短信、电话、邮件,个人偏爱微信,电话是终极利器。界面如下图。

如果告警被确认就不会继续发送其他提醒。微信版告警截图如下:

最新文章

  1. JS /JQuery 获取变量为数字时 容易出错 可能不是数字类型
  2. DB SQL Monitor 阻塞及等待事件监控工具
  3. RegularHelper
  4. Android:Butter Knife 8.0.1配置
  5. Bean实例化(Spring源码阅读)-我们到底能走多远系列(33)
  6. Button的图像位置设置
  7. C盘空间不足
  8. iOS上传文件,有关http上传协议-RFC1867
  9. laravel数据库查询返回的数据形式
  10. js 颜色16进制转RGB方法
  11. linux scp 使用方法
  12. Day10 Python基础之特殊函数(八)
  13. android自己定义控件之飞入飞出控件
  14. eclipse中导入java类失败的问题
  15. 每日Scrum(8)
  16. 一个简单python爬虫的实现——爬取电影信息
  17. HDU Today hdu 2112
  18. RabbitMQ入门_02_HelloWorld
  19. nginx转发请求
  20. MYSQL5.5源码安装 linux下

热门文章

  1. swoole父进程和子进程之间通信的例子
  2. docker overlay原理
  3. 多测师讲解selenium _a标签定位()_高级讲师肖sir
  4. 多测师讲解python ____字典,字符,元组,集合(转换)___高级讲师肖sir
  5. 2020年在项目中使用MVVM正确姿势,你用对了吗?
  6. Gradle的构建过程都不会?带你全面了解Android如何自定义Gradle 插件
  7. pytest文档44-allure.dynamic动态生成用例标题
  8. go视频提取音频
  9. centos8环境判断当前操作系统是否虚拟机或容器
  10. Linux系统及第三方应用官方文档