经常会有一些Hadoop监控的需求,例如datanode节点掉线,Tasktracker blacklist的数量,以及Namenode,Jobtracker的内存GC信息等. 之前采用Hadoop API获取这类信息插入Mysql,再用php脚本做逻辑判断并发送报警.这种做法代价比较高,需要在每个集群部署一个java用以收集信息. 后来发现hadoop提供了一个JMX的json数据接口,可以比较方便的得到这些信息.只需在页面上便可访问到,例如namenode 只需要将http://nameno