#!/bin/bash

while [ 1 ]

do

   job_error_no=`kubectl get pod -n weifeng |grep -i "job"|grep -ci error`

   if [ $job_error_no -gt 0  ];then
ps -fe|grep k8s_job_status_monitor|grep -v grep|awk '{print $2}'|xargs kill -9
echo "k8s job running is not stable " >> /tmp/k8s_job_error_no.log fi
sleep 60 done

  

若k8s集群job状态出现error , 脚本自动kill 掉自己的 montior进程, 通过阿里云的云监控进程监控来触发报警

阿里云云监控  进程监控 文档  https://www.cnblogs.com/weifeng1463/p/11591796.html

最新文章

  1. Python的列表推导式,字典推导式,集合推导式使用方法
  2. 解决window2012 IIS8 配置的网站无法下载exe文件的问题
  3. Jexus针对Asp.net core应用程序的六大不可替代的优势
  4. 记录排查解决Hubble.Net连接Oracle数据库建立镜像库数据丢失的问题
  5. ltib学习抄录
  6. C++-类的const成员变量
  7. html5制作一个时钟
  8. [easyui] datebox源码阅读. 批注
  9. I.MX6 U-boot GPIO hacking
  10. javascript基础进阶——执行环境及作用域链
  11. javascript 手势(swipeLeft,swipeRight)滑动中使用css3动画卡顿,开启硬件加速
  12. MYSQL复制原理及其流程
  13. P3373 【模板】线段树 2
  14. go的语法
  15. 在新建的python3环境下运行jupyter失败的原因
  16. TCP简单回射程序
  17. 《算法》第六章部分程序 part 4
  18. InnoDB FULLTEXT
  19. HashTable HashMap HashSet区别(java)
  20. 【UVa】1601 The Morning after Halloween(双向bfs)

热门文章

  1. ECS上搭建Docker(CentOS7)
  2. kafka源码导入idea/eclipse
  3. winform子窗口与父窗口的交互-使用委托与事件
  4. sonarqube+sonar runner分析C#代码
  5. 浅谈Vue.js2.0核心思想
  6. 判读是不是对象字面量(纯对象)。对象字面量创建方式有{}、new Object()创建
  7. python如何以表格形式打印输出
  8. 隐马尔科夫模型(Hidden Markov Models) 系列之四
  9. ASM磁盘操作笔记
  10. iOS 上传appstore 一直卡在正在通过 App Store 进行鉴定(转)