主要的软硬件配置:

x86台式机,window7  64位系统
vb虚拟机(x86的台式机至少是4G内存,才干开3台虚机)
centos6.4操作系统
hadoop-1.1.2.tar.gz
jdk-6u24-linux-i586.bin
WinScp 远程文件传输工具,非常好用。能够用于windows和虚拟机Linux之间文件相互拷贝。

一、root下的配置

a) 改动主机名:vi /etc/sysconfig/network

Master,slave1,slave2

b) 解析Ip: vi /etc/hosts

192.168.8.100 master

192.168.8.101 slave1

192.168.8.102 slave2

c) 调试网络:

採用网桥连接网络,配置网络。

改动后记得调用 service network restart

确保三台虚拟机可以相互ping通。

d) 关闭防火墙

查看:service  iptables  status

关闭:service  iptables  stop

查看防火墙有无自启动:

Chkconfig –-list | grepiptables

关闭自启动:

Chkconfig  iptables  off

二、yao用户下的配置

a) 创建用户yao,设置password,进入用户

useradd yao

passwd 123456

b) master创建公私秘钥

ssh-keygen –t rsa

1)将id_rsa.pub复制给authorized_keys

Cp id_rsa.pub authorized_keys

2)将master中的authorized_keys复制给slave1的/home下

scp id_rsa.pub root@192.168.8.101:/home

3)将master拷贝过来的authorized_keys拷贝到slave1本身所创的authorized_keys下,同理slave2的也是。最后达到任一个authorized_keys中都包括全部机组的公钥。

4)将hadoop拷贝拷贝到相应的机子中/home/yao/Documents/

在root下配置环境变量:vi /etc/profile

export HADOOP_HOME=/home/yao/Documents/hadoop

export HADOOP_HOME_WARN_SUPPRESS=1

export PATH=.:$PATH:$HADOOP_HOME

注:su + username实现切换用户。

5)安装jdk,解压时须要授权;

Chmod u+x jdk。。。

解压。

配置环境变量:vi /etc/profile

6)改动/hadoop/conf下的配置文件

改动core-site.xml

改动hdfs-site.xml

改动mapred-site.xml

7)改动hadoop/conf/hadoop-evn.xml文件,这里指定jdk的路径。

export JAVA_HOME=/usr/local/jdk

8)改动/hadoop/conf/masters  和slaves,相应协商虚拟机的名称,让hadoop知道主机和datanode;

Masters:  Master

Slavers:  Slave1   Slave2

三、拷贝hadoop

上述master中的hadoop配置基本完毕了,因为namenode节点上的hadoop配置是同样的,所以如今将master上的hadoop分别复制到slave1和slave2上。

命令:

Scp -r ./hadoop yao@slave1:/home/yao/

Scp -r ./hadoop yao@slave2:/home/yao/

拷贝完毕后,在master机器上hadoop文件夹下运行:

格式化:Bin/hadoop namenode -format

下一步,运行启动:

Bin/start-all.sh

在slave1中,输入jps:

类似的在slave2中,输入jps,也能得到相同的结果:

总结:

配置这样的全分布式的hadoop集群,分为几个步骤:

1)配置Hosts文件

2)建立Hadoop执行账号

3)配置ssh免password连入

4)下载并解压hadoop安装包

5)配置namenode,改动site文件

6)配置hadoop-env.sh

7)配置masters,和slaves文件

8)向个节点复制hadoop

9)格式化namenode

10)启动hadoop

11)用jps检验各后台进程是否成功启动

注:不能眼高手低,从装机開始,每一步都会遇到各种各样的问题须要解决。这是个熟悉指令和hadoop文件机制的过程。

伪分布式

伪分布式的搭建是很easy的,由于它是单一的节点,上述步骤仅仅须要:

1)建立Hadoop执行账号

2)配置ssh免password连入(单一节点,仅仅要将id_rsa.pub拷贝到authorized_keys中就能实现自身免password)

3)下载并解压hadoop安装包

4)下载jdk,并解压安装

5)改动site文件

6)配置hadoop-env.sh

7)格式化namenode

8)启动hadoop

9)用jps检验各后台进程是否成功启动

OK,基本上理解hadoop搭建的过程,伪分布和全分布都是非常easy的。

最新文章

  1. 数据库join方式分析
  2. LeetCode 217 Contains Duplicate
  3. jquery.uploadify 动态传递参数
  4. js 对象深复制,创建对象和继承
  5. word 批量删除书签
  6. wghd的git代码仓库分支管理说明【转】
  7. Qt for Android 程序禁止屏幕旋转
  8. JAVA js的escape函数、解析用js encodeURI编码的字符串、utf8转gb2312的函数
  9. Windows 8/8.1系统下硬盘占用率100%的问题解决思路汇总
  10. 秒味课堂Angular js笔记------指令
  11. 经常使用ARM汇编指令
  12. iOS断点及打印日志
  13. 03(3) 基于GMM-HMM的SR基础
  14. 成员函数的const到底修饰的是谁
  15. LOJ #2116 Luogu P3241「HNOI2015」开店
  16. sass 和less 分别在循环 和超出省略方面的区别!
  17. 【C++】C++中变量的声明与定义的区别
  18. linux 切分文件
  19. eclipse中怎么调出左边项目列表,解决方法:主界面的最上面一栏的Window--ShowView--Project Explorer
  20. 改变jupyter notebook默认初始文件路径 - 关于快捷方式

热门文章

  1. java接口传递数据的实例
  2. Android自定义控件(三)——有弹性的ListView
  3. Java 编程下使用 Class.forName() 加载类
  4. openssl 证书请求和自签名命令req详解
  5. DataTable复制自身行
  6. (转)深入理解 __doPostBack
  7. 0301——Notification 通知
  8. UISearchDisplayController简单使用
  9. vc中调用Com组件的方法详解
  10. hdu find the safest road