spark standalone集群部署 实践记录
2024-08-24 06:22:13
本文记录了一次搭建spark-standalone模式集群的过程,我准备了3个虚拟机服务器,三个centos系统的虚拟机。
环境准备:
-每台上安装java1.8
-以及scala2.11.x (x代表后面的版本随意)
-以及spark2.2.0
注意:scala和spark的版本要匹配,可以查看spark安装目录下的scala包的版本号来找相应的scala包。java要安装1.8的不然会报错。任务提交时driver会和集群节点传输文件所以集群中各个节点要保存driver的ssh公钥。
以上软件安装好后去到spark/sbin 目录下启动start-master,通过webUI看运行情况,浏览器输入http://10.217.2.240:8080/,IP是master的IP,端口在master输出的日志里面找。
然后启动slave程序,start-slave.sh spark://10.217.2.240:7077,IP是master的IP,端口在master的日志里面找。完了可以看slave节点的webUI,http://10.217.2.241:8081/,端口信息都在日志里面去找。
slave启动后可以在master的UI中看到slave的情况。(注意:如果在其他机器访问虚拟机中的UI访问不到有可能是防火墙的问题,执行systemctl stop firewalld.service,systemctl disable firewalld.service关闭虚拟机防火墙)
看到UI上面提示有worker的信息了,说明这个standalone集群就部署好了.
最新文章
- Burp Suite新手指南
- 2016 年 50 个最佳的轻量级 JavaScript 框架和库
- 【poj1085】 Triangle War
- c#面向对象基础 类、方法、方法重载
- SQL Server窗口函数:ROWS与RANGE
- mysql外键详解
- GDB+GDBServer调试Linux应用程序
- wxpython StatuBar 带进度条的状态栏
- Java使用freemarker导出word和excel
- PHP数据访问批量删除(10261101)
- css 权重 特殊性
- 【django之form和认证系统小练习】
- C++设计模式——外观模式
- Confluence 6 针对 key ";cp_"; 或 ";cps_"; 的 ";Duplicate Entry"; 问题解决
- js instanceof 检测某个对象是否是另一个对象的实例
- JAVA记录-redis缓存机制介绍(一)
- 注意:WordPress栏目别名slug不要设为p
- 解决oracle导入未分配表空间的问题
- 清幽傲竹实现的kbmMWServer数据库联接失败重联(转载红鱼儿)
- springMVC容器和Spring容器