简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。

学习目录

1.Cloudera Hadoop 环境搭建

2.使用Docker搭建Cloudera Hadoop 环境搭建

3.HDFS基本Shell操作

4.Hadoop编程调用HDFS(JAVA)

5.Hadoop编程调用HDFS(PYTHON)

最新文章

  1. H5是什么,CSS3又是什么?
  2. 把代码搬到Git Hub 吧(一)
  3. html生成图片并保存到本地方法(Windows)
  4. Atitit.attilax重要案例 项目与解决方案与成果 v6 qa15
  5. Bootstrap_导航条
  6. Java程序员最常用的8个Java日志框架
  7. sql中的字符串匹配、函数大全
  8. 窗口截图(可指定HWND窗口句柄)(三篇文章)
  9. Android 网络通信框架Volley基本介绍
  10. POJ--3258 River Hopscotch (最小值最大化C++)
  11. mac清除某个端口的占用
  12. 基于kettle的简单HTTP接口监控
  13. hibernate入门一
  14. 网站建设部署与发布--笔记3-部署Nginx
  15. 最近学习工作流 推荐一个activiti 的教程文档
  16. Oracle EBS PO退货失败
  17. Django-Form表单(验证、定制、错误信息、Select)
  18. Android Dialog 的一些特性
  19. word 文档刷文字格式
  20. python学习(二十二) Python 中boolean

热门文章

  1. 阶段1 语言基础+高级_1-3-Java语言高级_06-File类与IO流_09 序列化流_6_练习_序列化集合
  2. TensorFlow学习笔记5-概率与信息论
  3. 安全运维 - Linux系统维护
  4. C#后台保存Cookie
  5. pandas入门(1)
  6. “希希敬敬对”队软件工程第九次作业-beta冲刺第二次随笔
  7. 【转载】如何编写ROS的第一个程序hello_world
  8. vue 运行时报 dependency was not found:错误
  9. 高性能JavaScript模板引擎实现原理详解
  10. Numerical Sequence (easy version)