原帖地址:http://blog.csdn.net/nsrainbow/article/details/36629339

我们这个教程是在 centos  上安装cdh的教程,并且使用的是yum方式。不建议使用界面化方式。由于用过linux的都知道,命令行出错更少。事实上更轻松更靠谱。

安装之前

1. 安装jdk

cdh5 相应的jdk 是 oracle-jdk 1.7.0_25 ,注意是 oracle-jdk ,千万别 yum install jdk 就完事了。由于那样装的是 openjdk

到这边 http://www.oracle.com/technetwork/java/javase/downloads/java-archive-downloads-javase7-521261.html#jdk-7u25-oth-JPR 搞个jdk

没用户的自己注冊一个

下来之后名字是一堆乱码。自己用mv改个名字

$ sudo su -
$ mv jdk-7u25-linux-x64.rpm\?AuthParam\=1404198323_f70f74ddcd70928c1bea4ac29f5c4e42 jdk.rpm
$ rpm -ivh jdk.rpm
$ vim /etc/profile

在最后加上

export JAVA_HOME=/usr/java/jdk1.7.0_25
export PATH=$JAVA_HOME/bin:$PATH

保存后执行

$ source /etc/profile
$ echo $JAVA_HOME
/usr/java/jdk1.7.0_25

2. 配置yum源(不建议)

该种方式配置最快。可是对于长期要使用或者学习hadoop的人来说不建议採用这样的方式。详情见下一种方式
$ vim /etc/yum.repos.d/cloudera-cdh5.repo

把以下这段粘贴进去

[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/
gpgkey = http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
enabled=1
gpgcheck = 1

然后保存

3. 构建自己的yum源(强烈建议)

强烈建议採用这样的方式,由于你学习和使用hadoop的过程是漫长的,在这个过程中cloudera的包有可能有升级了几个版本号,那么你早先时候装的组件跟你后来想装的组件之间的版本号有可能不一样,有些组件会检查CDH版本号的统一性的,假设不通过就装不上了。或者执行起来有问题。

所以为了保证整个cdh内部组件的版本号一致性,最好使用这样的方式安装

3.1 下载rpm文件

安装rpm文件
yum --nogpgcheck localinstall cloudera-cdh-5-0.x86_64.rpm -y 

3.2 安装apache

安装的过程我就不说了。这样的教程网上一堆

3.3 安装yum-utils

yum install yum-utils createrepo -y

3.4 用yum-utils同步整个yum源

随便切换到一个文件夹,比方 home 文件夹把 可是确保你所在的文件夹有至少3G空间,然后运行

$ cd ~
$ reposync -r cloudera-cdh5

接下来可能是漫长的等待。取决于你的网络速度

这个命令运行完后会把整个cdh5的库(大概118个包)下载到这个文件夹下,大概2.3G

你会看到有一个叫 cloudera-cdh5 的目录生成,进入后有一个 RPMS 目录,里面有 noarch 和 x86_64 目录

[root@localhost ~]# cd cloudera-cdh5
[root@localhost cloudera-cdh5]# ll
total 4
drwxr-xr-x. 4 root root 4096 Dec 18 07:55 RPMS
[root@localhost cloudera-cdh5]# cd RPMS
[root@localhost RPMS]# ll
total 16
drwxr-xr-x. 2 root root 4096 Dec 18 16:07 noarch
drwxr-xr-x. 2 root root 12288 Dec 18 16:07 x86_64

高速下载诀窍:这边有一个诀窍。你開始运行 reposync 之后你会发如今运行这个命令的根文件夹会自己主动生成  cloudera-cdh5/noarch 文件夹,并開始下载包。

事实上我们能够直接用浏览器打开  http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/RPMS 你会看到有 noarch 和 x86_64 这两个文件夹,进入这两个文件夹。用迅雷把这些包所有下载下来,然后扔到centos的 cloudera-cdh5 文件夹下,再运行
 reposync 命令,然后这些包会被一一检查,并被觉得已经下载好了。并跳过。

我用的是火狐的Flashgot插件的 一键下载所有链接方式。

在 RPMS/x86_64 里面建一个目录 cdh  在这个目录里面建一个文本文件叫 RPM-GPG-KEY-cloudera
訪问 http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera  把内容拷贝进去

3.5 部署到apache

把这个cloudera-cdh5文件夹整个移到apache的web文件夹:/var/www/html 里面去,只是请先保证空间足够大,假设不够大。记得改动apache的web文件夹的位置,详细怎么改自己百度下

[root@localhost ~]# mv cloudera-cdh5 /var/www/html
[root@localhost ~]# cd /var/www/html
[root@localhost html]# ll
total 4
drwxr-xr-x. 3 root root 4096 Dec 18 07:49 cloudera-cdh5

用vim打开 /etc/httpd/conf/httpd.conf 查找到这句话

<Directory "/var/www/html">

这个节点里面的 Options 后面的文字改成 MultiViews

Options MultiViews

然后重新启动apache

service httpd restart

打开自己的浏览器试试看訪问这个地址

http://192.168.199.126/cloudera-cdh5/RPMS/noarch/whirr-0.9.0+cdh5.2.1+12-1.cdh5.2.1.p0.6.el6.noarch.rpm

ip改成你自己的机器的ip,假设浏览器自己主动開始下载这个文件的话。证明调通了


3.6 构建repo库

cd 到 /var/www/html/cloudera-cdh5 然后运行 createrepo . 进行构建

[root@localhost ~]# cd /var/www/html/cloudera-cdh5/
[root@localhost cloudera-cdh5]# createrepo .

3.7 改动yum源地址

分别把两台机器的/etc/yum.repos.d/cloudera-cdh5.repo 里面的 baseurl 改动为这台机器的地址。像我就改动成这样

[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://192.168.199.126/cloudera-cdh5/
gpgkey = http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
enabled=1
gpgcheck = 1

注意:採用这样的方式后,安装hadoop都将很的快。可是假设有时候不能正常安装,那么你还是能够启用远程地址,建议把下面两句话用注解方式保存在这个文件中面,当你认为可能本地库有问题,想切换为远程库的时候能够方便的切换。这个文件就变成这样

[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://192.168.199.126/cloudera-cdh5/
gpgkey = http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
#baseurl=http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/
#gpgkey = http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
enabled=1
gpgcheck = 1

当你要切换远程库的会后把上面两行 baseurl 和 gpgkey 凝视起来,以下的把凝视去掉,保存退出即可,yum会马上生效不须要做什么额外的操作。


注意:假设你之前用过远程源的模式安装过hadoop,那么切换成本地源之后要删除掉yum的缓存。否则会出现要安装的组件须要的版本比你本地的源还新,造成找不到安装文件的问题。清理方式是把 /var/cache/yum/x86_64/6/cloudera-cdh5 这个目录删了

0. 选择安装模式

有两种安装模式 HA 和 非HA

事实上MapReduce也有两种安装模式 1.0(MRv1) 和 2.0(YARN) 国外已经主要推广 2.0了。只是国内的非常多教程是依照1.0来写的,所以看教程的时候记得分辨一下看是否适合你。

只是我相信国内非常快也会跟上的。

我推荐使用2.0,我们的教程这边也使用2.0

hadoop有两种安装模式:非HA和HA模式,非ha仅仅是用来实验上手而已。真实环境用ha。可是ha环境配置比較复杂,easy被卡主,所以我们先用非HA模式上手一下,然后玩玩hdfs找找感觉,免得失去信心。然后再安装HA模式。所以我的教程会教你们装两次,第一次是非HA模式,第二次是HA模式,在安装HA模式之前最好换新的虚拟机,防止,之前的安装影响到新的安装

最新文章

  1. python基本图像操作与处理
  2. iOS -- 上传多张图片 后台(PHP)代码和上传一张的一样
  3. Android之线程终止
  4. Unreachable catch block for IOException. This exception is never thrown from the try statement body
  5. Linux教学辅助训练(第二阶段)
  6. stdarg.h头
  7. mysql进阶(二十六)MySQL 索引类型(初学者必看)
  8. 【学亮IT手记】Servlet的生命周期
  9. pycharm显示Unresolved reference
  10. VSCode的终端修改
  11. django之创建第4-2个项目-访问class类属性和类方法
  12. MySQL修改密码和忘记ROOT密码
  13. 使用截图工具FastStone Capture
  14. SQL Server 字符串合并
  15. ZOJ-2753
  16. win32 application怎么把结果输出到调试窗口
  17. ASP.NET动态网站制作(26)-- Ajax
  18. springmvc 学习笔记1
  19. ZK请求处理
  20. 绘制弧形:imagearc() 说明:三点钟的位置是起点(0度

热门文章

  1. RxJava操作符总结之过滤
  2. Laravel之队列
  3. 标准库Queue的实现
  4. vue-router push
  5. Singleton单例模式是最简单的设计模式,它的主要作用是保证在程序执行生命周期中,使用了单类模式的类仅仅能有一个实例对象存在。
  6. java精确除法计算,四舍五入 Java问题通用解决代码
  7. .NET CORE 2.0小白笔记(四):asp.net core输出中文乱码的问题
  8. Android开发之Conversion to Dalvik format failed问题解决
  9. PHP接收和发送XML数据(json也通用)
  10. vim与windows/linux之间的复制粘贴小结