hadoop 创始人 DogCutting

  高效,可扩展性,高容错性,价格低廉的大数据软件处理架构

  主要应用于数据分析、数据实时查询、数据挖掘领域

HDFS(HadoopDistributeFileSystem 分布式文件系统)

总结:从字面意思我们可以简单理解为:hadoop是用来处理大数据的,HDFS是用来存储大数据的。

-*-hadoop项目结构-*-

MapReduce 主要用于离线计算

Tez (DAG计算)基于YAN之上生成无向循环图,优化计算

Spark 和Mapreduce相似在内存中进行运算,性能高

HIve hadoop上的数据仓库(可用于企业数据分析),会把SQL语句转化为MapReduce运行

Pig 一个基于Hadoop的大规模数据分析平台,提供类似SQL的查询语言PigLatin

Oozie 工作流调度工具

Zookeeper 分布式调度服务

Hbase Hadoop上的非关系型分布式数据库(分布式列数据库)

flume  流数据日志收集分析

Sqoop 在hadoop和传统平台之间互导数据

Ambari 安装部署工具

最新文章

  1. jQuery的deferred对象学习
  2. jquery实现输入框实时输入触发事件代码
  3. 现在写 PHP,你应该知道这些
  4. Java异常处理和设计【转】
  5. Solaris 10下Qt编译Oracle 10g驱动
  6. spring源码学习之:xml配置文件标签自定义
  7. ASP.NET的一套笔试题
  8. Demo Swig
  9. hdu2039java
  10. FragmentTransaction.addToBackStack无效的问题
  11. ARM Cortex M3(V7-M架构)硬件启动程序 一
  12. 使用MSPT实现二层冗余
  13. jdbc_servlet基础增删改分页2(userinfo表的)
  14. OAuth2.0记录
  15. Linux技术栈整理一:系统体系结构
  16. window 10 删除带有管理员权限的Oracle文件夹
  17. UIWebView的高度不对问题
  18. 查看当前的app运行的是哪个Activity
  19. HLS playlist典型示例
  20. Linux 文件特殊权限详解[suid/sgid/t]

热门文章

  1. bzoj4543 [POI2014]Hotel加强版 长链剖分+树形DP
  2. map接口、hashmap常用方法
  3. Clean Docker <none>:<none>
  4. Task8.循环和递归神经网络
  5. python-数据驱动
  6. linux运维、架构之路-Nginx反向代理
  7. C#语句,console,C#//,/**/
  8. phpexcel如何读和写大于26列的excel
  9. properties与yml之间的比较
  10. Java网络编程与NIO详解2:JAVA NIO 一步步构建IO多路复用的请求模型