还是hadoop专有名词进行说明。

Hadoop框架中最核心设计就是:HDFS和MapReduce.还有yarn

HDFS提供了海量数据的存储。(分布式文件系统)

MapReduce提供了对数据的计算.(分布式计算框架)

Hadoop的集群主要由 NameNode,DataNode,Secondary NameNode,JobTracker,TaskTracker组成.

NameNode中记录了文件是如何被拆分成block以及这些block都存储到了那些DateNode节点.

NameNode同时保存了文件系统运行的状态信息.

DataNode中存储的是被拆分的blocks.

Secondary NameNode帮助NameNode收集文件系统运行的状态信息.

JobTracker当有任务提交到Hadoop集群的时候负责Job的运行,负责调度多个TaskTracker.

TaskTracker负责某一个map或者reduce任务.

其中NameNode,secondary NameNode,JobTracker运行在Master节点上,DataNode和TaskTracker运行在Slave节点上。

后面会写一些hadoop在工作中常用的命令。和hadoop开发上的问题。

最新文章

  1. CDDA 源码解析
  2. FLEX布局的一些问题和解决方法
  3. 【java】之对List中每个对象元素按时间顺序排序
  4. dev_set_draw的fill和margin模式
  5. Velocity笔记
  6. inotify配合rsync实现文件同步
  7. sql server 2008 express 使用ip登陆 error:40 错误:2
  8. Python操作memcached及redis
  9. 无法加载协定为“ServiceReference1.xxxxx”的终结点配置部分,因为找到了该协定的多个终结点配置。请按名称指示首选的终结点配置部分
  10. C#堆栈和托管堆
  11. Freemarker例子
  12. POJ 1329 三角外接圆
  13. [置顶] css3 befor after 简单使用 制作时尚焦点图相框
  14. web前端学习之路
  15. Linux入门之常用命令(5)Bash
  16. Xpath语法详解
  17. 小A的位运算-(前缀和+位运算)
  18. php数组函数大全
  19. java329 继承、类的高级概念
  20. 二十四. Python基础(24)--封装

热门文章

  1. python 列表的内容赋值
  2. static使用实例
  3. 纯css3实现的圆形旋转分享按钮
  4. 一款纯css3实现的超炫动画背画特效
  5. wp中的位图
  6. PHP中Array的hash函数实现
  7. python 提示 AttributeError: module 'json' has no attribute 'dumps'
  8. iOS边练边学--Segue数据逆传(用block代替delegate)
  9. MongoDB(四):MongoDB连接和创建数据库
  10. Spring 4 官方文档学习(十一)Web MVC 框架