一、基础

1.了解Java、Linux操作系统相关知识

2.如需精进,应为水平要达到一定标准,能够阅读国外相关技术网站,eg:http://hadoop.apache.org/

二、什么是Hadoop

照搬官网并略作翻译:

The Apache™ Hadoop® project develops open-source software for reliable, scalable, distributed computing.

The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using simple programming models. It is designed to scale up from single servers to thousands of machines, each offering local computation and storage. Rather than rely on hardware to deliver high-availability, the library itself is designed to detect and handle failures at the application layer, so delivering a highly-available service on top of a cluster of computers, each of which may be prone to failures.

The project includes these modules:

  • Hadoop Common: The common utilities that support the other Hadoop modules.
  • Hadoop Distributed File System (HDFS™): A distributed file system that provides high-throughput access to application data.
  • Hadoop YARN: A framework for job scheduling and cluster resource management.
  • Hadoop MapReduce: A YARN-based system for parallel processing of large data sets.

Hadoop系统是一个稳定、分布式计算相关开源软件系统。

Hadoop框架通过使用集群中的简单程序模型支持大数据的分布式计算,它可以从单台计算机拓展到上千台提供本地计算和存储功能的服务器组成的集群。与以往系统使用硬件保证高可用方式不同,Hadoop在应用层可以检测、处理异常,因此通过集群顶层的服务保证高可用性。

Hadoop主要分为以下模块:

(1)Hadoop Common:支持其他模块的公共工具

(2)HDFS:分布式文件系统,用于提供系统数据存储服务(相当于oracle的存储模块)

(3)Hadoop YARN:工作与资源调度模块,相当于基于HDFS的操作系统

(4)Hadoop MapReduce:基于YARN系统的分布式计算方法

三、系统划分

最新文章

  1. [原创]java使用JDBC向MySQL数据库批次插入10W条数据测试效率
  2. 使用IHTMLDocument2解决弹出"为了让该网站给你提供个人化信息,是否允许在你计算机放置cookie?"
  3. SQL--空值处理
  4. 04传智_jbpm与OA项目_部门模块改进_直接在BaseAction中实现ModelDriven<T>
  5. 日常笔记 ---- 图形学-Frenel函数材质球实现方式
  6. 使用NPOI操纵Excle,并输入到客户端
  7. Java-----instanceof、isInstance、isAssignableFrom
  8. CentOS7配置VNC Server
  9. php使用flock阻塞写入文件和非阻塞写入文件的实例讲解
  10. 分享一个单例模型类Singleton代码
  11. PyCharm运行Nosetests并导出测试报告
  12. Linux退出状态码
  13. CNCF CloudNative Landscape
  14. C程序第三次作业
  15. 使用Maven根据WSDL生成生成Java代码
  16. 05: greenlet:轻量级的并发编程
  17. SCU 4439 Vertex Cover(二分图最小覆盖点)题解
  18. <string.h>的学习
  19. 原生JS简单的无缝自动轮播
  20. JAVA 监控工具 VisualVM 插件路径配置地址

热门文章

  1. Appium scroll 滑动查找
  2. [转]OAuth 2.0 - Authorization Code授权方式详解
  3. ActiveMQ笔记(6):消息延时投递
  4. C语言学习 第十次作业总结
  5. 昆仑游戏[JS加密修改]
  6. CoreOS和Docker入门
  7. HTML中为何p标签内不可包含div标签?那哪些块元素里面不能放哪些块元素呢?
  8. 拷贝excel里的内容转为JSON的js代码
  9. WebStorm 2016.2.3的安装与汉化
  10. Leetcode 69. Sqrt(x)