前期准备:

1.系统基本形况:

ip hostname role server loginName
192.168.1.101 h1 NameNode,ResourceManager centos7_64 hwd
192.168.1.102 h2 DataNode, NodeManager centos7_64 hwd
192.168.1.103 h3 DataNode, NodeManager centos7_64 hwd

2.各个系统之间实现用自己的用户名ssh无密钥登陆

3.在各个机器上安装java

4.先在其中一台机器上解压hadoop

5.关闭各个机器的防火墙

6.在各个机器上配置环境变量,建议每台服务器上的java和hadoop放置位置都相同,如把java解压到:/usr/java/文件夹下,把hadoop解压到/home/hwd/文件夹下,这样可以方便操作。

注意:此时是,每台机器上都安装好了java环境,但只有一台电脑上有hadoop,但每台机器上都配置了这两个软件的环境变量,因为需要修改hadoop,修改好后再拷到其余机器上即可。

环境变量参考:

在~/.bashrc文件中添加以下配置:

export JAVA_HOME=/usr/java/jdk1.7.0_67
export HADOOP_DEV_HOME=/home/hwd/hadoop-2.4.1
export HADOOP_MAPARED_HOME=${HADOOP_DEV_HOME}
export HADOOP_COMMON_HOME=${HADOOP_DEV_HOME}
export HADOOP_HDFS_HOME=${HADOOP_DEV_HOME}
export YARN_HOME=${HADOOP_DEV_HOME}
export HADOOP_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop
export HDFS_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop
export YARN_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop
export PATH=$PATH:$HADOOP_DEV_HOME/bin:$JAVA_HOME/bin:$HADOOP_DEV_HOME/sbin

#lixun64位的系统加上下面的环境变量,

#否则启动时会出现“name or service not known” Warning警告,

#请参考http://stackoverflow.com/questions/21326274/hadoop-2-2-0-name-or-service-not-known-warning

export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_DEV_HOME}/lib/native
 export HADOOP_OPTS="-Djava.library.path=${HADOOP_DEV_HOME}/lib"

配置完成后,执行source ~/.bashrc命令(也可以修改文件/etc/profile)

对hadoop的修改如下其中修改文件的位置在$hadoop2.4.1/etc/hadoop文件夹下:

1.修改文件$hadoop2.4.1/etc/hadoop/hadoop-env.sh文件:

export JAVA_HOME=/usr/java/jdk1.7.0_67

2.配置core-site.xml文件,设置namenode的服务器位置。

3.修改hdfs-site.xml文件,建议dfs.data.dir的路径设置成自己用户目录下的一个位置,这样可以在运行hadoop时避免修改该位置的权限。

dfs.data.dir : Determines where on the local filesystem an DFS data node should store its blocks

dfs.replication : Default block replication. The actual number of replications can be specified when the file is created. The default is used if replication is not specified in create time.

<configuration>
  <property>
    <name>dfs.data.dir</name>
    <value>/home/hwd/data</value>
<!--数据节点存储块的目录的列表-->
  </property>
  <property>
    <name>dfs.replication</name>
    <value>2</value>
</property>

4.修改mapred-site.xml文件(该文件不存在,执行cp mapred-site.xml.template mapred-site.xml命令,从mapred-site.xml.template复制一份),修改文件内容为:

 <configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

5.修改文件yarn-site.xml,修改后的内容为:

 <configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>h1</value>
</property> <property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property> </configuration>

6.修改文件slaves,修改后的内容为:

7.至此,文件就修改好了,然后修改后的hadoop拷到各个服务器上。

用命令可以很方便的进行操作:

scp -r /home/hwd/hadoop-2.4.1 h2:/home/hwd

scp -r /home/hwd/hadoop-2.4.1 h3:/home/hwd

8.启动hadoop

1).  在h1服务器上运行命令:

hdfs namenode -format     //格式化namenode

start-dfs.sh       //启动hdfs系统

此时,用jps命令查看java运行的java进程如下(此时如果没错误的话,在namenode节点上启动的进程有:NameNode ,SecondaryNameNode):

此时,查看datanode节点上的java进程如下:

2).运行命令:start-yarn.sh

此时namenode节点的java进程为:

此时datanode节点上的java进程为:

9.至此分布式的hadoop测试环境就搭好了。

结束语:

期间可能没有这么顺利,如果启动后各个节点的进程缺少,请查看各个节点的日志信息,来排除错误。

如:我的hadoop启动日志信息位置如下图所示(在启动过程中会在控制台显示日志文件的位置):

在该信息中,如果在您的namenode节点中namenode进程没启动起来,则进入h1节点,查看对应的.log文件,来排除错误

datanode节点同理去datanode节点服务器上查看对应的.log文件。

关闭hadloop分别运行命令:

stop-dfs.sh

stop-yarn.sh

参考:http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/

最新文章

  1. github创建文件夹
  2. Sqli-LABS通关笔录-2
  3. server application error应用错误
  4. 在MS SQLSERVER中如何最快的速度清空所有用户表的数据
  5. pageX和pageY
  6. Linux系统编程——进程间通信:命名管道(FIFO)
  7. java基础知识回顾之java Thread类学习(八)--java多线程通信等待唤醒机制经典应用(生产者消费者)
  8. [King.yue]关于代码调试时的缓存问题的一个解决办法
  9. poj 3469 Dual Core CPU【求最小割容量】
  10. Java中循环删除list中元素的方法总结
  11. 有趣 IOS 开展 - block 使用具体解释
  12. doT模板
  13. Live555 直播源 以及MediaSubsession
  14. obj-c编程15[Cocoa实例04]:基于Core Data的多文档程序示例[未完待续]
  15. window系统下如何查看so库的信息
  16. FloatingActionButtonDemo【悬浮按钮的使用,顺带snackBar的使用】
  17. var、let 及 const 区别
  18. W3C的标准到底是啥?
  19. springboot情操陶冶-SpringApplication(一)
  20. Fiddler抓包6-get请求(url详解)

热门文章

  1. 中文录入问题 转载自:http://blog.csdn.net/ichsonx/article/details/8625925
  2. java.util.Queue
  3. react-native-page-scrollview 的使用方法(实现酷炫的分页轮播效果,还支持自定义View)
  4. HDU 3374 exkmp+字符串最大最小表示法
  5. Mybatis源码学习之整体架构(一)
  6. Java并发之同步工具类
  7. Job for docker.service failed because the control process exited with error code. See
  8. 【Spark机器学习速成宝典】推荐引擎——协同过滤
  9. 数据库 | Redis 缓存雪崩解决方案
  10. Faster R-CNN论文阅读摘要