今日学习内容:

主要为Hadoop的环境配置,相关配置所需文档可以留言(?)会给发送

1.hadoop介绍:

狭义:

核心组件,Hadoop

hdfs  分布存储

yarn   资源管理和任务调度框架

mapreduce  计算  (企业基本不再直接使用)

广义:

围绕Hadoop打造的大数据生态圈

Hadoop发行版本:

开源社区:http://hadoop.apache.org/

商业版本:cloudera和hortonworks

Hadoop架构变迁:

1.0-2.0框架优化

2.0-3.0性能优化

2.Hadoop集群概述:

包括,hdfs,yarn 逻辑上分离,物理上在一起,标准的主从架构集群

不存在mapreduce集群,mapreduce是计算框架,位于代码层面,不存在集群的说法

3.Hadoop集群的安装

下载网址;Index of /dist/hadoop/common/hadoop-3.3.0 (apache.org)

课程提供了安装包,有编译好的安装包。

3.1集群角色规划

3.2基础环境准备

部分提前配置过了,以下是验证:

免密登录ssh:

时间同步:

创建统一工作目录:

安装jdk在三台机器上:

node1:先拖动导server目录下

解压并且验证安装:

拷贝到node2下jdk:

node3:修改上面的node2为node3即可

拷贝环境变量:

3.3 拷贝结束后同时重新加载环境变量

使用命令:

source /etc/profile

下面主要通过node1安装,node2,node3通过scp命名

3.4 上传Hadoop资源并且解压:

3.5Hadoop环境配置

配置三类文件:

编辑环境变量

将配置完成后的文件夹以及profile都发送到另外两台机器

至此完成Hadoop的配置文件的修改,并且保证了三台机器都可以识别Hadoop命令

最新文章

  1. mysql常处理用时间sql语句
  2. Autorelease返回值的快速释放机制
  3. printf(),类型修饰符
  4. 解决yum update失败
  5. 51Node 1483----化学变换(暴力枚举)
  6. 03 Hibernate错题分析
  7. aspx与mvc页面验证码
  8. jsp js java
  9. 多线程程序 怎样查看每个线程的cpu占用
  10. HDU 4931 Happy Three Friends(水)
  11. GDAL切割重采样遥感图像
  12. SAP ECC EHP7 RFC 发布成WebService
  13. lesson - 6 Linux下磁盘管理
  14. 三十、小程序解析HTML(对富文本返回数据的处理)
  15. [python] [Jupyter Notebook]
  16. 将选中项的value值赋给select的title
  17. mac gcc develop
  18. vsftpd下错误之:500 OOPS
  19. 本地存储—localStorage(HTML5)
  20. 沉淀再出发:OpenStack初探

热门文章

  1. jQuery-强大的jQuery选择器 (详解)
  2. 面试题 --MySQL索引
  3. .net core格式化响应数据(json驼峰格式)
  4. 3、k8s 核心实战
  5. 【C++】fstream文件操作
  6. Java-获取真实用户ip
  7. 【杂项】瞎玩——suhr RIOT单块制作流程
  8. pkill 直接对进程对名字进行操作,可以同时杀死多个进程。
  9. linux 的防火墙 ufw、firwalld、iptables 、
  10. 在windows上远程linux (待完善)