RDD:弹性分布式数据集, 是分布式内存的一个抽象概念

RDD:1.一个分区的集合,

    2.是计算每个分区的函数 ,

      3.RDD之间有依赖关系

   4.一个对于key-value的RDD的Partitioner

5.一个存储存取每个Partition的优先位置的列表

RDD算子:

Transformations:不会立即执行,只是记录这些操作

Actions:计算只有在action被提交的时候才被触发。

RDD依赖关系:

窄依赖指的是每一个父RDD的Partition最多被子RDD的一个Partition使用

宽依赖指的是多个子RDD的Partition会依赖同一个父RDD的Partition

最新文章

  1. 安装MySql for Visual Studio的坑
  2. react+redux官方实例TODO从最简单的入门(1)-- 前言
  3. Python入门笔记(8):列表
  4. Spring-MVC流程图
  5. BZOJ2783: [JLOI2012]树
  6. ViewData ViewBag TempData
  7. LINQ标准查询操作符(四) —AsEnumerable,Cast,OfType,ToArray,ToDictionary,ToList,ToLookup,First,Last,ElementAt
  8. Java设计模式01:设计模式的 分类 和 设计原则
  9. PHP安全编程:网站安全设计的一些原则(转)
  10. j2ee开源项目——IT学习者博客(itxxzblog v1.0)
  11. csdn博客被一个无名网站套用,不知大家是否也是这样?
  12. php操作xml并插入到数据库中
  13. MyBatis之简单了解Plugin
  14. 在centos7上实现LAMP的全过程及实现wordpress
  15. eclipse工具按键翻译
  16. DEBUG经历
  17. Maven集成SSM
  18. linux下批量杀死进程
  19. webkit下面的CSS设置滚动条
  20. Oracle exp/imp 导出/导入

热门文章

  1. 学习笔记:location.hash和history.pushState()
  2. ElasticSearch 5学习(5)——第一个例子
  3. 用sql语句按周、按月、按季、按年统计
  4. linux下获取外网IP
  5. tomcat下的公共jar包配置
  6. double类型的小数,四舍五入保留两位小数
  7. 使用ASP.NET Web API和Web API Client Gen使Angular 2应用程序的开发更加高效
  8. javaweb基础(29)_EL表达式
  9. Cobbler自动安装的Linux系统ssh无法进入
  10. 循环 -----JavaScript