一、MapReduce1.x架构

1)jobTracker:JT

作业的管理者

将作业分解成一堆任务:Task(MapTask和ReduceTask)

将任务分派给TaskTracker(TT)运行

作业监控、容错处理(task作业挂了,重启task的机制)

在一定的时间间隔内,JT没有收到TT的心跳信息,TT可能是挂了,TT上运行的任务会被指派到其他TT上去执行。

2)TaskTracker:TT

任务的执行者

在TT上执行Task(MapTask和ReduceTask)

会与JT交互:执行/启动/停止作业,发送心跳信息给JT

3)MapTask

自己开发的map任务交由task处理

解析每条记录数据,交给自己的map方法处理

将map的输出结果写到本地磁盘(有些作业仅有map,没有reduce,结果直接写到HDFS等数据存放库)

4)ReduceTask

将MapTask输出的数据进行读取

按照数据进行分组传给我们自己写的reduce方法处理

输出结果到HDFS等数据存放库

二、MapReduce2.x架构

最新文章

  1. 安装pip
  2. 【JAVA、C++】LeetCode 004 Median of Two Sorted Arrays
  3. jquery 实现ajax 上传文件的功能(使用插件 ajaxfileupload)
  4. POJ_1269_Intersecting_Lines_(计算几何基础)
  5. 5事件DOM零级事件跟DOM二级事件
  6. mybati之运行过程
  7. SPOJ GSS1 && GSS3 (无更新/更新单点,并询问区间最大连续和)
  8. Map <STL>
  9. POJ 3419 Difference Is Beautiful
  10. ecshop商品页增加编辑器fckeditor
  11. Python并发编程之消息队列补充及如何创建线程池(六)
  12. POJ 2771 Guardian of Decency(最大独立集数=顶点数-最大匹配数)
  13. Luogu4770 NOI2018你的名字(后缀数组+线段树)
  14. Linux运维学习笔记-iptables知识总结
  15. C语言作业03-函数
  16. ref:如何将自定义异常的信息显示在jsp页面上
  17. Spring.net(一)----Spring.NET框架简介及模块说明
  18. POJ3061 Subsequence 尺取or二分
  19. Django学习笔记之Django ORM Aggregation聚合详解
  20. YUM工具使用

热门文章

  1. 基于C语言文件操作的学生成绩管理系统
  2. 【NX二次开发】点到矢量或直线的垂点
  3. 【题解】Luogu p2016 战略游戏 (最小点覆盖)
  4. HTTP首部字段详解
  5. C#调百度通用翻译API翻译HALCON的示例描述
  6. 利用ServletContext,实现Session动态权限变更
  7. Vue(5)计算属性computed
  8. python-geopandas读取、创建shapefile文件
  9. vue 快速入门 系列 —— vue loader 上
  10. python随机漫步