Hadoop高可用集群存在的一些共性问题

1.NameNode 偶然性挂掉

问题原因: 用群启脚本启动HA集群,启动过程中NameNode要依赖于JournalNode,所以在启动过程中, ​ NameNode会主动连接JournalNode 但是 NN 和 JN启动是异步的,所以导致NN可能不会即时连接JN成功, ​ NN 默认情况下会反复连接10次,每间隔1000毫秒 连一次。

通过修改core-site.xml 以下默认配置

方法一:首先手动启动journalnode,再手动启动namenode

方法二:修改core-site.xml中的ipc参数

	方法二:修改core-site.xml中的ipc参数

	<property>
<name>ipc.client.connect.max.retries</name>
<value>100</value>
<description>
Indicates the number of retries a client will make to establisha server connection.
</description>
</property> <property>
<name>ipc.client.connect.retry.interval</name>
<value>10000</value>
<description>Indicates the number of milliseconds a client will wait for
before retrying to establish a server connection.
</description>
</property>

  

2.模拟将active状态的及其kill掉,自动故障转移时出现的问题

查看zookee中的信息,内容显示已经改变,但是在高可用集群中没有显示。

psmisc插件没装

[root@hadoop100 ~]# yum install -y  net-tools vim psmisc  nc  rsync  lrzsz  ntp libzstd openssl-static tree iotop git

  

3.高可用集群中为什么能使用原来中心化集群的群启脚本?

因为群启脚本最后作用于哪套Hadoop环境取决于 Linux的环境变量的配置!!!

最新文章

  1. swift_属性观察者
  2. Excel学习笔记
  3. 详解NTFS文件系统
  4. yii学习笔记
  5. 策略模式代替大量的if else
  6. kafka集群和zookeeper集群的部署,kafka的java代码示例
  7. Java应用架构的演化之路
  8. ORACLE 11G用于有效期
  9. Java学习-Overload和Override的区别
  10. Android布局自定义Shap圆形ImageView,可以单独设置背景与图片
  11. Hibernate事务传播性
  12. MySql 日期转字符串
  13. 配置nginx以获取真实的客户端ip地址
  14. 端口被占用:android studio 虚拟机adb.exe已停止工作的处理
  15. 第一次作业:来自一个奋斗的IT学子
  16. MIP 内容声明
  17. PHP 安装扩展 phpize
  18. linux的挂载含义
  19. 微软BI 之SSIS 系列 - 变量查询语句引起列输出顺序不一致的解决方法
  20. Difference between ID and control.ClientID OR why use control.ClientID if I can access control through ID

热门文章

  1. MyBatis_03(核心配置文件解析)
  2. JS中call、apply、bind
  3. 为什么要有jvm,jvm的作用?
  4. Django Rest Frame work 如何使用serializers序列化
  5. docker 可视化平台Portainer搭建
  6. 如何在Debian10镜像中设置Nginx引擎模块
  7. git push 时发生的error: failed to push some refs to
  8. pytorch循环神经网络实现回归预测 代码
  9. CICD中一个巨头--jenkins
  10. css动画-滚动通知