1. 增加一个节点

1. 拷贝cm的jar包到该节点
2. 设置hostname(hostnamectl set-hostname XXX),然后修改hosts文件
3. 所有的节点添加该hostname
4. 修改agent配置文件,指向cloudera manager节点;启动cm
5. 进入到管理页面,host -> add new hosts to cluster ->选择已经被识别出来机器(只要启动agent,配置正确就可以被识别出来,手动发现的流程,证明agent没有起来或者配置异常,手动发现的流程,在安装过程将会从网上下载安装包,而不是parcels那种安装方式)
因为启动cm之后才修改hostname,导致被cloudera manager识别为127.0.0.1,没事,只要重启agent即可。
2. role日志分析
  cloudera异常日志中的role日志虽然在安装页面是空,但是点进去之后将会看到详细的日志;比如zookeeper中就是告诉我: Unable to access datadir, exiting abnormally,但是datadir是/var/lib/zookeeper啊,有啊;后来点入role full log之后,才看到是:
error occured while purging.
org.apache.zookeeper.server.persistence.FileTxnSnapLog$DatadirException: Missing data directory /var/lib/zookeeper/version-2, automatic data directory creation is disabled (zookeeper.datadir.autocreate is false). Please create this directory manually.
    at org.apache.zookeeper.server.persistence.FileTxnSnapLog.<init>(FileTxnSnapLog.java:102)
    at org.apache.zookeeper.server.PurgeTxnLog.purge(PurgeTxnLog.java:68)
    at org.apache.zookeeper.server.DatadirCleanupManager$PurgeTask.run(DatadirCleanupManager.java:140)
    at java.util.TimerThread.mainLoop(Timer.java:555)
    at java.util.TimerThread.run(Timer.java:505)
够详细吧,因为之前装了dcos,所以估计这个datadir的目录结构被篡改了;于是在zookeeper的配置中将zookeeper.datadir.autocreate设置为true,问题解决。
3. 重装CDH集群
  cloudera的删除一个集群之后,将会删掉/opt/cloudera/parcles下面所有的包;
  重装集群的话,需要把dfs以及/var/lib/zookeeper文件夹删掉。
4. cloiudera manager的硬盘空间不够
  安装完毕kerberos之后,启动集群失败,发现zookeeper启动的时候爆了一个异常:Error found before invoking supervisord: [Errno 28] No space left on device;发现应该是slave1机器上面的。但是通过df -h发现确实有一个100%的,就是cm_processes,这个分区只有1.9G,已经100%了。
  于是进去看,其实关键是四个文件夹很占用空间:*-collect-host-statistics文件夹都是上百M的,本来分配的空间就小,这几个文件夹直接把这个分区给干满了。因为一看是收集的统计信息,就直接删掉,系统OK了。

最新文章

  1. Segment set
  2. iOS开发——UI基础-KVO
  3. linker command failed with exit code 1 (use -v to see invocation)
  4. (34)odoo反代理中客户IP处理
  5. 有关使用seajs和template模板的总结
  6. “VS2013无法连接远程数据库”解决方案
  7. 绘制n边形:用两个以上的控件来控制矩形的颜色、大小、位置及空实心(程序代写)
  8. uva 1471 defence lines——yhx
  9. POJ 1321 棋盘问题 --- DFS
  10. Oracle中的单行函数
  11. notepad++ tab键用空格缩进
  12. c#读写注册表示例分享
  13. sed awk 要获得每行的最后一个逗号后边的内容
  14. HDU 1199 - Color the Ball 离散化
  15. Thrift RPC实战(二) Thrift 网络服务模型
  16. hdu 1394 Minimum Inversion Number(这道题改日我要用线段树再做一次哟~)
  17. 给我的cnblogs主页做一个响应式布局模板
  18. 用UIWebView加载本地图片和gif图
  19. 几种常用hash算法及原理
  20. 使用limit查询的同时取得总的记录数:SQL_CALC_FOUND_ROWS和FOUND_ROWS()

热门文章

  1. 在fc6上搭tftpd
  2. POJ 2856 Y2K Accounting Bug【简单暴力】
  3. oschina git服务, 如何生成并部署ssh key
  4. TextView属性
  5. 使用OpenSSL工具制作X.509证书的方法及其注意事项总结
  6. 2014阿里实习生面试题——MySQL如何实现索引的
  7. (转)基于libRTMP的流媒体直播之 AAC、H264 推送
  8. linux 10 -Bash Shell编程
  9. LeetCode:删除排序链表中的重复元素【83】
  10. oss2模块和aliyun oss链接