问题背景

spark是以客户端的方式安装的,并没有启动spark的mesos集群,这时候的spark就相当与hive客户端。
以local模型和yarn-cluster方式提交任务,都能正确额执行,但是一yarn-client方式就卡在ACCEPTED

问题原因

在网上查了资料,都说是资源不够用,需要调整yarn.scheduler.capacity.maximum-am-resource-percent从0.1改成0.5,但是我测试数据才几k,集群内存128G,所以我直接排除了这个原因
后来想到,只有yarn-client方式失败,那问题应该出来driver端。就查看了一下服务器的/etc/hosts,发现diver上有集群其他节点的IP等信息,但是其他节点没有driver配置信息
导致driver能访问到集群,但是集群其他节点访问不了driver
所以local模式可以执行
yarn-cluster上可以执行,是因为客户端只要把任务提交到yarn上,客户端就没有用了。
但是yarn-client方式,客户端是充当了driver,driver需要一直和集群有通信,所以接收不到resouceManager的反馈。任务就一直卡住了

解决办法:

有两个方法:
1、在命令后面加上一个--conf spark.driver.host=$your_ip_address,后面直接填客户端机器的IP地址就行
spark-submit \
--master yarn \
--deploy-mode client \
--num-executors 2 \
--executor-memory 1G \
--executor-cores 1 \
--conf spark.driver.host=192.168.72.129\
dmp_broadcast_data_day.py
    2、在集群其他节点上都把driver服务器的IP加上去。

最新文章

  1. EF里的继承映射关系TPH、TPT和TPC的讲解以及一些具体的例子
  2. nginx架构
  3. [Codevs 1421]秋静叶&秋穣子(最大-最小博弈)
  4. Linux重定向命令
  5. Improve Scalability With New Thread Pool APIs
  6. java和C++在多态实现上的区别
  7. Navicat Premium 11 For Mac 注册机
  8. mongodb添加权限
  9. MSSQL 镜像
  10. AngularJS 深入理解 $scope 转载▼
  11. 2.1Android界面View及ViewGroup(转)
  12. Verilog code
  13. OpenGL直线点画模式
  14. 利用flask 实现简单模版站
  15. [SQL]LeetCode197. 上升的温度 | Rising Temperature
  16. Python 多进程multiprocessing
  17. react开发初始配置和一些问题
  18. Codeforces Round #409 (rated, Div. 2, based on VK Cup 2017 Round 2) 题解【ABCDE】
  19. Notepad++ 列操作
  20. 线程间的通信方式3--Handler

热门文章

  1. ubuntu笔记1-vim安装报错
  2. Oracle_PLSQL创建用户表空间
  3. Mybatis27题
  4. AttributeError: 'Model' object has no attribute 'name'
  5. 11 JavaScript Utility Libraries you Should Know in 2019
  6. numpy的文件存储.npy .npz 文件详解
  7. 解决window的bat脚本执行出现中文乱码的问题
  8. npm link用法总结
  9. CentOS7下安装Nexus私服及基础配置
  10. matlab学习笔记13_3创建函数句柄