Action介绍

在RDD上计算出来一个结果

把结果返回给driver program或保存在文件系统,count(),save

常用的Action



reduce()

接收一个函数,作用在RDD两个类型相同的元素上,返回新元素。

可以实现,RDD中元素的累加,计数,和其它类型的聚集操作。

举例:

val rdd = sc.parallelize(Array(1,2,3,3))
rdd.collect()

collect()

遍历整个RDD,想driver program返回RDD的内容

需要单机内存能容纳下(因为数据要拷贝给driver,一般是测试的时候使用)

大数据的时候,使用saveAsTextFile() action等。

take(n)

返回RDD中的n个元素(同时尝试访问最少的的partitions)

返回结果是无序的,一般为测试时候使用

top(n)

返回排序后的前n个,(根据RDD中的数据比较器)

RDD的特性











最新文章

  1. <<MySchool数据库设计优化>> 内部测试
  2. commonjs AMD,CMD
  3. UDP收发buffer尺寸对收发包流量的影响
  4. angularjs 1.x $q模块使用
  5. .NET Mvc Razor也可以这样玩!
  6. AlwaysOn数据同步问题探究
  7. VC++ 标准C++中的string类的用法总结
  8. STF(SmartPhone Test Farm)Mac版本环境搭建
  9. spring读取properties的方法
  10. 第六篇、微信小程序-form组件
  11. tomcat启动报错:Unsupported major.minor version 51.0
  12. C语言基础学习运算符-关系运算符
  13. 批处理删除IIS的everyone、users的访问权限
  14. 使用EF操作Mysql数据库中文变问号的解决方案
  15. SVN/GIT精简使用教程
  16. “多个单核CPU”与“单个多核CPU”哪种方式性能较强?
  17. C# 多线程下 静态类字段异常
  18. MySQL表与表之间的SQL Joins图介绍
  19. Python 增强类库
  20. 只需两步获取任何微信小程序源码

热门文章

  1. C语言编程入门之--第五章C语言基本运算和表达式-part4
  2. 因为配置了Always-On导致的无法Drop Login...
  3. (四十五)c#Winform自定义控件-水波图表
  4. hmac模块和hashlib模块
  5. 设计模式(C#)——02抽象工厂模式
  6. GMTC 2019-前端夜话《聊聊前端工程师的成长和发展》会后简要总结
  7. 多线程编程学习六(Java 中的阻塞队列).
  8. JDBC工具类连接数据库,模仿登录
  9. CFdiv2 165E. Compatible Numbers 子集枚举
  10. gym/102021/K GCPC18 背包dp算不同数和的可能