spark的每个RDD都会记录从创建到当前算子的依赖(血缘关系),当该RDD的部分分区数据丢失时,它可以根据这些信息来重新运算和恢复丢失的数据分区 ---  toDebugString 方法查看

OneToOneDependency窄依赖,上游的RDD的一个分区被下游的RDD的一个分区所独享(独生子女)

ShuffleDependency宽依赖,上游的RDD的一个分区被下游RDD的多个分区所共享(多生子女)

最新文章

  1. 如何将github上的 lib fork之后通过podfile 改变更新源到自己fork的地址
  2. Object.observe
  3. Thinking in java学习笔记之初始化
  4. python 学习笔记九 队列,异步IO
  5. Virtual Friend Function
  6. Errors running builder "Integrated External Tool Builder" on project
  7. Web APP 随笔
  8. Android开发之Service的写法以及与Activity的通信
  9. jquery选择器中逗号的使用
  10. js面试题-2
  11. socket.io 入门篇(二)
  12. (转)spring aop(下)
  13. BZOJ 3123: [Sdoi2013]森林 [主席树启发式合并]
  14. Oracle:常用的一些基本操作
  15. VMWare的网络
  16. Codeforces899C Dividing the numbers(数论)
  17. 安全工具-cansina
  18. 用jQuery监听浏览器窗口的变化
  19. 07-django项目
  20. 编译错误 error C2451: “std::_Unforced”类型的条件表达式是非法的

热门文章

  1. .Net 6 miniAPI
  2. 使用python编写简单的api接口
  3. LeetCode-1219 黄金矿工
  4. Vulnhub:katana靶机
  5. 生成brobuff
  6. MessageUtil
  7. 解决MySQL5.5MySQLInstanceConfig最后一步setting报错
  8. 回归分析 3.X 多元线性回归
  9. linux升级系统内核
  10. CodeGym自学笔记12——类名