Hadoop高可用集群存在的一些共性问题
2024-10-22 08:34:48
Hadoop高可用集群存在的一些共性问题
1.NameNode 偶然性挂掉
问题原因: 用群启脚本启动HA集群,启动过程中NameNode要依赖于JournalNode,所以在启动过程中, NameNode会主动连接JournalNode 但是 NN 和 JN启动是异步的,所以导致NN可能不会即时连接JN成功, NN 默认情况下会反复连接10次,每间隔1000毫秒 连一次。
通过修改core-site.xml 以下默认配置
方法一:首先手动启动journalnode,再手动启动namenode
方法二:修改core-site.xml中的ipc参数
方法二:修改core-site.xml中的ipc参数 <property>
<name>ipc.client.connect.max.retries</name>
<value>100</value>
<description>
Indicates the number of retries a client will make to establisha server connection.
</description>
</property> <property>
<name>ipc.client.connect.retry.interval</name>
<value>10000</value>
<description>Indicates the number of milliseconds a client will wait for
before retrying to establish a server connection.
</description>
</property>
2.模拟将active状态的及其kill掉,自动故障转移时出现的问题
查看zookee中的信息,内容显示已经改变,但是在高可用集群中没有显示。
psmisc插件没装
[root@hadoop100 ~]# yum install -y net-tools vim psmisc nc rsync lrzsz ntp libzstd openssl-static tree iotop git
3.高可用集群中为什么能使用原来中心化集群的群启脚本?
因为群启脚本最后作用于哪套Hadoop环境取决于 Linux的环境变量的配置!!!
最新文章
- swift_属性观察者
- Excel学习笔记
- 详解NTFS文件系统
- yii学习笔记
- 策略模式代替大量的if else
- kafka集群和zookeeper集群的部署,kafka的java代码示例
- Java应用架构的演化之路
- ORACLE 11G用于有效期
- Java学习-Overload和Override的区别
- Android布局自定义Shap圆形ImageView,可以单独设置背景与图片
- Hibernate事务传播性
- MySql 日期转字符串
- 配置nginx以获取真实的客户端ip地址
- 端口被占用:android studio 虚拟机adb.exe已停止工作的处理
- 第一次作业:来自一个奋斗的IT学子
- MIP 内容声明
- PHP 安装扩展 phpize
- linux的挂载含义
- 微软BI 之SSIS 系列 - 变量查询语句引起列输出顺序不一致的解决方法
- Difference between ID and control.ClientID OR why use control.ClientID if I can access control through ID