实验环境

Hadoop版本：CDH 5.3.6

*本实验项目所需软件均可在百度网盘链接：http://pan.baidu.com/s/1dFeNR6h 密码：1zx4中获取。

安装 Hadoop

上传hadoop文件到/usr/local目录下

rz

解压

tar -zxvf hadoop-2.5.0-cdh5.3.6.tar.gz

删除tar包

rm -rf hadoop-2.5.0-cdh5.3.6.tar.gz

重命名
mv hadoop-2.5.0-cdh5.3.6 hadoop

设置环境变量

vi ~/.bashrc

export HADOOP_HOME=/usr/local/hadoop

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin

生效设置

source ~/.bashrc

测试

hadoop

hadoop version

yarn

yarn version

创建/usr/local/data目录

配置文件

修改core-site.xml文件

cd /hadoop/etc/hadoop

ls

vi core-sie.xml

<property>

  <name>fs.default.name</name>

  <value>hdfs://sparkproject1:9000</value>

</property>

修改hdfs-site.xml

<property>

  <name>dfs.name.dir</name>

  <value>/usr/local/data/namenode</value>

</property>

<property>

  <name>dfs.data.dir</name>

  <value>/usr/local/data/datanode</value>

</property>

<property>

  <name>dfs.tmp.dir</name>

  <value>/usr/local/data/tmp</value>

</property>

<property>

  <name>dfs.replication</name>

  <value>2</value>

</property>

修改mapred-site.xml

cp mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

<property>

  <name>mapreduce.framework.name</name>

  <value>yarn</value>

</property>

修改yarn-site.xml

<property>

  <name>yarn.resourcemanager.hostname</name>

  <value>sparkproject1</value>

</property>

<property>

  <name>yarn.nodemanager.aux-services</name>

  <value>mapreduce_shuffle</value>

</property>

修改slaves

sparkproject2

sparkproject3

sparkproject1是主节点，sparkproject2和sparkproject3是从节点

在另外两台虚拟机上搭建hadoop

在sparkproject1上使用scp命令将配置好的文件传输到另外两个虚拟机上

cd /usr/local

scp -r hadoop root@sparkproject2:/usr/local

scp -r hadoop root@sparkproject3:/usr/local

scp ~/.bashrc root@sparkproject2:~/

scp ~/.bashrc root@sparkproject3:~/

在sparkproject2和sparkproject3上分别执行