1)以WordCount为例,具体代码如下:

 import org.apache.spark.SparkConf
import org.apache.spark.SparkContext;
import org.apache.spark.SparkContext._
/**
* Created by hfz on 2016/4/21.
*/
object test2 {
def main (args: Array[String]){
var conf=new SparkConf().setAppName("WordCount").setMaster("local");
var sc=new SparkContext(conf);
var rdd=sc.textFile("data/README.md");
rdd.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_);
rdd.collect(); } }

如果我们希望深入到sc.textFile()内部搞清楚都做了什么操作,如果是Java的话,我们直接CTRL+B,IDEA就自动把jar包中的字节码反编译为Java源码,并且,我们可以直接下个断点调试程序,但是对于Scala,IDEA的反编译效果并不是很好,如下图所示:

2)提示“Source not found”,我们在看textFile()方法,只可以看到方法的参数列表,方法体的内容却看不到,只能看到“compiled code”也就是“编译后的代码”。解决方法如下:

a.下载Spark1.4源码

b.然后点击右上角的“Attach Source”,添加源码,如下所示:

添加路径是“spark1.4.0/core/src/main/scala/org”,然后点击OK确定。“Attching”完成之后,我们就可以看到textFile()的方法体了,并且可以像之前调试hadoop一样,在这个方法下断点,运行程序的时候,会在这里命中断点,如下所示(这里只是加了个断点,没有调试):

最新文章

  1. FastClick 填坑及源码解析
  2. 如何在SharePoint 当中使用纯JSOM上传任意二进制文件(小于2MB)
  3. 看看C# 6.0中那些语法糖都干了些什么(上篇)
  4. STL三种标准容器
  5. Ubuntu14.04下安装Hadoop2.5.1 (单机模式)
  6. 什么是Nib文件?(Nib文件是一种特殊类型的资源文件,它用于保存iPhone OS或Mac OS X应用程序的用户接口)
  7. ECharts中文显示为Unicode码
  8. ORACLE安装过程中检查步骤出现的错误和解决方法【转】
  9. 1.Cocos2dx 3.2中vector,ValueMap,Touch触摸时间的使用.iconv字符编解码
  10. Loj #6073.「2017 山东一轮集训 Day5」距离
  11. .NET:一微秒内可能执行多条 DateTime.Now
  12. 【GISER && Painter】矢量切片(Vector tile)
  13. POJ 3176 Cow Bowling(dp)
  14. 【DB2】SQL0437W Performance for this complex query may be sub-optimal
  15. java学习de路线建议
  16. 【LOJ】#2384. 「HNOI2013」切糕
  17. json格式的javascript对象用法分析
  18. select2 选择框插件
  19. Varnish 学习资料收集
  20. python财经数据接口包Tushare pro的入门及简单使用方式(大数据,股票数据接口)

热门文章

  1. 程序员的那些问题---转载自veryCD
  2. windows10-seaslog安装笔记
  3. xcode 10 新特性
  4. CodeForces - 682B 题意水题
  5. [BZOJ3238][Ahoi2013]差异解题报告|后缀数组
  6. 【BZOJ】1571: [Usaco2009 Open]滑雪课Ski
  7. 12.22笔记(关于CALayer//Attributes//CALayer绘制图层//CALayer代理绘图//CALayer动画属性//CALayer自定义子图层//绘图pdf文件//绘图渐变效果)
  8. [bzoj1486][HNOI2009]最小圈——分数规划+spfa+负环
  9. Linux 格式化磁盘命令mkfs
  10. Kuangbin 带你飞 数位DP题解