主要架构图


各部分作用

* Core:核心支持,内核代码
* MapReduce:映射数据
* HDFS:文件存储
* ZooKepper:服务器节点和进程通信的协调工具
* Pig:支持用户和MapReduce(java)交互的语言工具
* Hive:支持SQL对数据查询的语言工具(可理解为一种关系型数据库),但是不支持所有SQL
* HBase:NoSql数据库,使用列式存储(提高响应速度,减少IO),用于数据分析。
* Chukwa:日志抓取

HDFS:

* Namenode   :
* HDFS守护程序
* 记录文件如何分割
* 对内存和IO集中管理
* 单节点,一旦崩溃集群就崩溃了 * Secondary Namenode:
* 主要作为Namenode的后备节点
* 每个集群一个
* 和Namenode通信,定期保存HDFS快照
* 是否自动切换? * DataNode
* 每台服务器一个
* 负责HDFS数据读写到本地 * JobTracker
* 运行在主节点,每个集群一个,总调度作用
* 处理用户提交
* 哪些文件要处理,要分割并分配
* 监控task,重启失败的task * TaskTracker
* 每个slave都有一个,和datanode结合使用,但是一个tasktracker可以启动多个jvm
* 管理自己节点的task
* 和jobtracker交互 * Master和slave
* Master不一定只有一个
* Master运行JobTracker、Namenode

最新文章

  1. .NET开发知识体系
  2. 【Qt】Qt之进程间通信(QProcess)【转】
  3. 一,彻底理解第一个C语言程序 Hello World
  4. Select the best path in a matrix
  5. python 多行字符串
  6. mysql主从复制错误:Last_SQL_Error: Error 'Duplicate entry '327' for key 'PRIMARY'' on query. Default database: 'xxx'. Query: 'insert into
  7. async And await异步编程活用基础
  8. 接口测试:如何定位BUG的产生原因
  9. 防反编译的加壳工具-Virbox Protector
  10. JQuery写的一个常见的banner
  11. Linux CFS调度器之task_tick_fair处理周期性调度器--Linux进程的管理与调度(二十九)
  12. 腾讯云centos7安装MySQL
  13. 17.Mysql分区
  14. LOJ 10155 - 「一本通 5.2 例 3」数字转换
  15. 解决Maven并行编译中出现打包错误问题的思路
  16. P2564 [SCOI2009]生日礼物
  17. msvcr100.dll问题描述及修复方式
  18. Linux之实用GDB技巧
  19. HBase表操作
  20. css隐藏元素

热门文章

  1. QString和char字符串数组之间的转换 (转)
  2. linux非root用户执行开机启动程序
  3. Vue2.x整合百度地图JavaScript方案
  4. Date类型之组件方法
  5. java web 程序---javabean代码,出现错误。奇怪,无法解释的运行问题
  6. 利用python,简单的词语纠错
  7. json串反转义(消除反斜杠)-- 转载
  8. 第8章 信号(1)_Linux信号处理机制
  9. 关于博主noble_
  10. ECCV 2018 | Bi-Real net:超XNOR-net 10%的ImageNet分类精度