Hadoop主要架构
2024-10-19 03:33:23
主要架构图
各部分作用
* Core:核心支持,内核代码
* MapReduce:映射数据
* HDFS:文件存储
* ZooKepper:服务器节点和进程通信的协调工具
* Pig:支持用户和MapReduce(java)交互的语言工具
* Hive:支持SQL对数据查询的语言工具(可理解为一种关系型数据库),但是不支持所有SQL
* HBase:NoSql数据库,使用列式存储(提高响应速度,减少IO),用于数据分析。
* Chukwa:日志抓取
HDFS:
* Namenode :
* HDFS守护程序
* 记录文件如何分割
* 对内存和IO集中管理
* 单节点,一旦崩溃集群就崩溃了
* Secondary Namenode:
* 主要作为Namenode的后备节点
* 每个集群一个
* 和Namenode通信,定期保存HDFS快照
* 是否自动切换?
* DataNode
* 每台服务器一个
* 负责HDFS数据读写到本地
* JobTracker
* 运行在主节点,每个集群一个,总调度作用
* 处理用户提交
* 哪些文件要处理,要分割并分配
* 监控task,重启失败的task
* TaskTracker
* 每个slave都有一个,和datanode结合使用,但是一个tasktracker可以启动多个jvm
* 管理自己节点的task
* 和jobtracker交互
* Master和slave
* Master不一定只有一个
* Master运行JobTracker、Namenode
最新文章
- .NET开发知识体系
- 【Qt】Qt之进程间通信(QProcess)【转】
- 一,彻底理解第一个C语言程序 Hello World
- Select the best path in a matrix
- python 多行字符串
- mysql主从复制错误:Last_SQL_Error: Error 'Duplicate entry '327' for key 'PRIMARY'' on query. Default database: 'xxx'. Query: 'insert into
- async And await异步编程活用基础
- 接口测试:如何定位BUG的产生原因
- 防反编译的加壳工具-Virbox Protector
- JQuery写的一个常见的banner
- Linux CFS调度器之task_tick_fair处理周期性调度器--Linux进程的管理与调度(二十九)
- 腾讯云centos7安装MySQL
- 17.Mysql分区
- LOJ 10155 - 「一本通 5.2 例 3」数字转换
- 解决Maven并行编译中出现打包错误问题的思路
- P2564 [SCOI2009]生日礼物
- msvcr100.dll问题描述及修复方式
- Linux之实用GDB技巧
- HBase表操作
- css隐藏元素