转自:http://blog.fens.me/series-hadoop-family/

Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。

从2011年开始,中国进入大数据风起云涌的时代,以Hadoop为代表的家族软件,占据了大数据处理的广阔地盘。开源界及厂商,所有数据软件,无一不向Hadoop靠拢。Hadoop也从小众的高富帅领域,变成了大数据开发的标准。在Hadoop原有技术基础之上,出现了Hadoop家族产品,通过“大数据”概念不断创新,推出科技进步。

作为IT界的开发人员,我们也要跟上节奏,抓住机遇,跟着Hadoop一起雄起!

学习路线图

Hadoop家族学习路线图 开篇必读

Hive学习路线图

Mahout学习路线图

编程实践

Hadoop历史版本安装

用Maven构建Hadoop项目

Hadoop编程调用HDFS

在Ubuntu中安装HBase

用Maven构建Mahout项目

Mahout推荐算法API详解

用MapReduce实现矩阵乘法

从源代码剖析Mahout推荐引擎

Mahout分步式程序开发 基于物品的协同过滤ItemCF

Mahout分步式程序开发 聚类Kmeans

PageRank算法并行实现

最新文章

  1. Postgresql扩展及UUID
  2. widows下jieba分词的安装
  3. error signing assembly unknown error
  4. sencha touch 框架的几种核心脚本文件之间的区别
  5. [Linux命令]tar命令
  6. dedecms likearticle 调用附加表的字段调用方式
  7. Hibernate 注解说明
  8. Docker Registry
  9. VB与C#语言部分不用的地方Part1
  10. spring-boot 使用 main函数 无法启动的问题完美 解决方案。
  11. hihoCoder 1288 Font Size 二分
  12. Java中的会话Cookie&&Session
  13. 2018-2019-20175205 实验三敏捷开发与XP实践《Java开发环境的熟悉》实验报告
  14. Monkey测试log的保存与分析
  15. ORACLE Index Lookup索引访问路径总结
  16. react-native 之gradle-2.x-all.zip 下载缓慢或失败
  17. CF1137C Museums Tour
  18. 如何用input标签上传多个图片并回显
  19. 基于mysql对mybatis中的foreach进行深入研究
  20. Java虚拟机(三):JVM垃圾回收机制

热门文章

  1. ubuntu12.04下helloworld驱动从失败到成功过程
  2. ios 推送app badge 数字累加操作
  3. UISlider 设置增量
  4. STL之hashtable源代码剖析
  5. CentOS6.5搭建MySQL5.1主从复制
  6. 按钮CSS样式
  7. 深入理解Android的密度独立性
  8. 转:Mosquitto配置----日志设置
  9. CSC时无法找到C:\Program Files\Microsoft SDKs\Windows\v6.0A\lib
  10. ArcGIS 10 安装程序及破解文件