原文地址:http://blog.csdn.net/lizhitao/article/details/24581907

1、监控目标

1.当系统可能或处于亚健康状态时及时提醒,预防故障发生

2.报警提示 a.短信方式 b.邮件

2、监控内容

2.1 机器监控

Kafka服务器指标

  1. CPU Load
  2. Disk IO
  3. Memory
  4. 磁盘log.dirs目录下数据文件大小,要有定时清除策略

2.2 JVM监控

主要监控JAVA的 GC time(垃圾回收时间),JAVA的垃圾回收机制对性能的影响比较明显

2.3 Kafka系统监控

1、Kafka总体监控

  • zookeeper上/XXX/broker/ids目录下节点数量
  • leader 选举频率

2、Kafka Broker监控

  • kafka集群中Broker列表,broker运行状况,包括node下线,活跃数量
  • Broker是否提供服务
  • 数据流量  流入速度,流出速度 (message / byte)
  • ISR 收缩频率

3、Kafka Controller监控

  • controller存活数目

4、Kafka Producer监控

  • producer数量,排队情况
  • 请求响应时间
  • QPS/分钟

5、Kafka Consumer监控

  • consumer队列中排队请求数
  • 请求响应时间
  • 最近一分钟平均每秒请求数

6、Topic监控

  • 数据量大小;
  • offset
  • 数据流量 流入速度,流出速度 (message / byte)

3.监控指标

3.1 JVM监控

a.通过JMX获取GC time

b.jvm full gc次数

        c.通过jmx监控kafka相关参数
 

3.2 kafka系统监控

监控数据获取方式

1、生存节点信息可以从zookeeper获取

2、除生存节点 和

a、Broker是否提供服务。

b、Topic数据量大小,

c、Topic的offset 外,其他数据都可以通过JMX获取

最新文章

  1. gulp自动化构建
  2. java.math.RoundingMode 几个参数详解
  3. C语言回顾-内存管理和指针函数
  4. orm获取关联表里的属性值
  5. BZOJ 1564: [NOI2009]二叉查找树
  6. Leetcode 160. Intersection of two linked lists
  7. MVC ajaxSubmit上传图片
  8. miaov- 自动生成正V反V大于号V小于号V楼梯等图案
  9. 自己遇到的Android虚拟机出现的错误及解决方法【不断更新】
  10. poj 4052(ac自动机)
  11. 【js】获得项目路径
  12. USB学习小记-HID类键盘的报告描述符的理解
  13. 月赛-Crackhash
  14. 如何在RHEL7上搭建Samba服务实现Windows与Linux之间的文件共享
  15. LINQ学习系列-----3.1 查询非泛型集合
  16. python常用的一些东西——sys、os等(转)
  17. [HNOI 2017]抛硬币
  18. display显示方式
  19. UI复习练习_优酷布局
  20. JS 日期与时间戳相互转化

热门文章

  1. Netty笔记
  2. 织梦dedecms后台添加图片style全部都变成st<x>yle的解决办法
  3. typdef struct 语法
  4. window.showModalDialog基础
  5. LFI漏洞利用总结(转载)
  6. Android源码编译的全过程记录
  7. Windows 7旗舰版搭建andriod 4.0开发环境记录
  8. NGUI panel使用soft clip时,屏幕缩放后无法正常工作的问题解决
  9. Outlook2010 移动数据文件到其它地方
  10. VirtualBox命令更改虚拟硬盘空间