以yarn-client方式提交spark任务,任务一直卡在ACCEPTED状态
2024-09-05 18:22:27
问题背景
spark是以客户端的方式安装的,并没有启动spark的mesos集群,这时候的spark就相当与hive客户端。
以local模型和yarn-cluster方式提交任务,都能正确额执行,但是一yarn-client方式就卡在ACCEPTED
问题原因
在网上查了资料,都说是资源不够用,需要调整yarn.scheduler.capacity.maximum-am-resource-percent从0.1改成0.5,但是我测试数据才几k,集群内存128G,所以我直接排除了这个原因
后来想到,只有yarn-client方式失败,那问题应该出来driver端。就查看了一下服务器的/etc/hosts,发现diver上有集群其他节点的IP等信息,但是其他节点没有driver配置信息
导致driver能访问到集群,但是集群其他节点访问不了driver
所以local模式可以执行
yarn-cluster上可以执行,是因为客户端只要把任务提交到yarn上,客户端就没有用了。
但是yarn-client方式,客户端是充当了driver,driver需要一直和集群有通信,所以接收不到resouceManager的反馈。任务就一直卡住了
解决办法:
有两个方法:
1、在命令后面加上一个--conf spark.driver.host=$your_ip_address,后面直接填客户端机器的IP地址就行
spark-submit \
--master yarn \
--deploy-mode client \
--num-executors 2 \
--executor-memory 1G \
--executor-cores 1 \
--conf spark.driver.host=192.168.72.129\
dmp_broadcast_data_day.py
2、在集群其他节点上都把driver服务器的IP加上去。
最新文章
- EF里的继承映射关系TPH、TPT和TPC的讲解以及一些具体的例子
- nginx架构
- [Codevs 1421]秋静叶&;秋穣子(最大-最小博弈)
- Linux重定向命令
- Improve Scalability With New Thread Pool APIs
- java和C++在多态实现上的区别
- Navicat Premium 11 For Mac 注册机
- mongodb添加权限
- MSSQL 镜像
- AngularJS 深入理解 $scope 转载▼
- 2.1Android界面View及ViewGroup(转)
- Verilog code
- OpenGL直线点画模式
- 利用flask 实现简单模版站
- [SQL]LeetCode197. 上升的温度 | Rising Temperature
- Python 多进程multiprocessing
- react开发初始配置和一些问题
- Codeforces Round #409 (rated, Div. 2, based on VK Cup 2017 Round 2) 题解【ABCDE】
- Notepad++ 列操作
- 线程间的通信方式3--Handler
热门文章
- ubuntu笔记1-vim安装报错
- Oracle_PLSQL创建用户表空间
- Mybatis27题
- AttributeError: 'Model' object has no attribute 'name'
- 11 JavaScript Utility Libraries you Should Know in 2019
- numpy的文件存储.npy .npz 文件详解
- 解决window的bat脚本执行出现中文乱码的问题
- npm link用法总结
- CentOS7下安装Nexus私服及基础配置
- matlab学习笔记13_3创建函数句柄