IDEA提交任务到spark standalone集群
2024-10-20 16:11:14
参考文章: 在idea里面怎么远程提交spark任务到yarn集群
代码
注意setJars,提交的代码,要提前打好包。否则会报找不到类的错误
个人理解就相当于运行的main方法是起了一个spark-submit任务,提交任务到集群时还是要指定好任务的jar包,以便复制到各个Executor执行代码。
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
object TestSparkStandalone {
def main(args: Array[String]): Unit = {
val conf = new SparkConf().setAppName("TestSparkStandalone")
.setMaster("spark://xxx.xxx.xxx.xxx:7077")
.setJars(List("D:\\CodePlace\\myspark\\target\\myspark-1.0-SNAPSHOT.jar"))
val spark = new SparkContext(conf)
val value: RDD[Int] = spark.makeRDD(1 to 5)
value.foreach(println _)
}
}
driver问题
报错内容:
Caused by: java.net.UnknownHostException: LAPTOP-2B1EN4I2
at java.net.InetAddress.getAllByName0(InetAddress.java:1281)
at java.net.InetAddress.getAllByName(InetAddress.java:1193)
at java.net.InetAddress.getAllByName(InetAddress.java:1127)
at java.net.InetAddress.getByName(InetAddress.java:1077)
解决方式:
回调driver端接口的时候域名解析问题,在executor的机器上配置hosts文件,将LAPTOP-2B1EN4I2指定对应的ip地址即可
最新文章
- 【Python】[面向对象高级编程] 使用__slots__,使用@property
- HTML div 滚动条样式设计
- Linq分组
- Basic linux command-with detailed sample
- poj2386(简单dfs)
- java lambda小纪
- 每个配置xml的含义作用
- Arrays常用API的事例
- SymPy-符号运算好帮手
- codeforces 633G. Yash And Trees dfs序+线段树+bitset
- Jquery遍历数组之$.inArray()方法介绍
- 【抽象那些事】不完整的抽象&;多方面抽象&;未用的抽象&;重复的抽象
- CodeForces 867B Save the problem
- Android开发颜色大全
- 'adb remount'的作用是什么?在什么情况下有用?
- oracle杀掉执行的死循环存储过程
- Android开发之漫漫长途 Ⅲ——Activity的显示之Window和View(2)
- Java GC 垃圾回收算法 内存分配
- 全方面了解和学习PHP框架
- Mysql提权