Hadoop hadoop的介绍和几种模式
Hadoop简介
Hadoop软件库是一个开源框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台计算机,每台计算机都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用程序层的故障,从而在计算机集群之上提供高可用性服务,每个计算机都可能容易出现故障。是大数据技术的基础。
hadoop生态系统
♥ hadoop分布式文件系统(HDFS):一种分布式文件系统,能够提供高可靠、高可用、可扩展以及对应用程序数据的高吞吐量访问。
♥ yarn :作业调度和资源管理的框架。
♥ MapReduce :基于yarn框架,用于并行计算处理大型数据集,是一种计算框架。
♥ ambari :基于Web的工具,用于配置,管理和监控Apache Hadoop集群,包括对Hadoop HDFS,Hadoop MapReduce,Hive,HCatalog,HBase,ZooKeeper,Oozie,Pig和Sqoop的支持。Ambari还提供了一个用于查看群集运行状况的仪表板,例如热图,以及可视化查看MapReduce,Pig和Hive应用程序的功能,以及以用户友好的方式诊断其性能特征的功能。
♥ avro :数据序列化系统。
♥ cassandra:可扩展的多主数据库,没有单点故障。
♥ hbase:可扩展的分布式数据库,支持大型表的结构化数据存储。
♥ hive:一种数据仓库基础架构,提供数据汇总和即席查询。
♥ pig:用于并行计算的高级数据流语言和执行框架。
♥ spark:用于Hadoop数据的快速通用计算引擎。Spark提供了一种简单而富有表现力的编程模型,支持广泛的应用程序,包括ETL,机器学习,流处理和图形计算。
♥ zookeeper:用于分布式应用程序的高性能协调服务。
Hadoop的四种模式
1、本地模式:
本地模式就是解压源码包,不需要做任何的配置。通常用于开发调试,或者感受hadoop。
2、伪分布模式:
在学习当中一般都是使用这种模式,伪分布模式就是在一台机器的多个进程运行多个模块。虽然每一个模块都有相应的进程,但是却还是运行在同一个系统里面。所以叫伪分布式。
3、完全分布式:
这种模式才是工作当中所用的模式,hadoop运行在多台机器上面,我们称之为hadoop集群。
4、HA:
在实际的工作当中,对于hadoop完全分布式来说,并不真正的可靠,因为hadoop完全分布式集群会有单点故障(namenode单点故障、yarn单点故障),所以一般都会对这个集群做HA,一般都是做namenode和yarn的高可用。
最新文章
- NOIp 11.11/12
- BackTrack5-r3任务栏显示网络图标及自定义DNS
- 使用mysql管理meta
- 我的音乐盒子(nodejs7 + koa2 + vue + vuex + vue-router)
- 再谈AbstractQueuedSynchronizer:独占模式
- laravel5.5 延时队列的使用
- Percona-Toolkit 之 pt-archiver 总结
- FlatList
- MySQL(数据类型和完整约束)
- Number of subarrays having sum exactly equal to k(explanation for 437. Path Sum III of leetcode)
- Maven入门系列(一):Eclipse中使用Maven
- Linux配置Redis外网访问
- [django]drf知识点梳理-分页
- <;Spark>;<;Programming>;<;Loading and Saving Your Data>;
- ReactiveX 学习笔记(8)错误处理和 To 操作符
- VS2015 之 多行缩进
- 20145309李昊《网络对抗技术》实验9 web安全基础实践
- sql service 备份
- 《Redis设计与实现》阅读笔记(一)--Redis学习
- android获取对话框文本注意事项
热门文章
- 记https在Android浏览器无法访问
- span标签中显示固定长度,超出部分用省略号代替,光标放到文字上显示全部
- iOS - 苹果官方Apple Pay开发文档(中文版)- Apple Pay(1)
- 13 个 JS 数组精简技巧
- Ubuntu安装opencv3.4.4教程
- js中的BOM和DOM常用事件方法
- Linux命令——killall 、kill 、pkill、xkill
- Vue 前后端分离系统中遇到跨域问题
- 无法访问此网站 ERR_CONTENT_DECODING_FAILED
- 【数组模拟的链表or复杂模拟】PAT-L2-002. 链表去重