Alex 的 Hadoop 菜鸟教程: 第2课 hadoop 安装教程 (CentOS6 CDH分支 yum方式)
原帖地址:http://blog.csdn.net/nsrainbow/article/details/36629339
我们这个教程是在 centos 上安装cdh的教程,并且使用的是yum方式。不建议使用界面化方式。由于用过linux的都知道,命令行出错更少。事实上更轻松更靠谱。
安装之前
1. 安装jdk
cdh5 相应的jdk 是 oracle-jdk 1.7.0_25 ,注意是 oracle-jdk ,千万别 yum install jdk 就完事了。由于那样装的是 openjdk
到这边 http://www.oracle.com/technetwork/java/javase/downloads/java-archive-downloads-javase7-521261.html#jdk-7u25-oth-JPR 搞个jdk
没用户的自己注冊一个
下来之后名字是一堆乱码。自己用mv改个名字
$ sudo su -
$ mv jdk-7u25-linux-x64.rpm\?AuthParam\=1404198323_f70f74ddcd70928c1bea4ac29f5c4e42 jdk.rpm
$ rpm -ivh jdk.rpm
$ vim /etc/profile
在最后加上
export JAVA_HOME=/usr/java/jdk1.7.0_25
export PATH=$JAVA_HOME/bin:$PATH
保存后执行
$ source /etc/profile
$ echo $JAVA_HOME
/usr/java/jdk1.7.0_25
2. 配置yum源(不建议)
$ vim /etc/yum.repos.d/cloudera-cdh5.repo
把以下这段粘贴进去
[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/
gpgkey = http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
enabled=1
gpgcheck = 1
然后保存
3. 构建自己的yum源(强烈建议)
所以为了保证整个cdh内部组件的版本号一致性,最好使用这样的方式安装
3.1 下载rpm文件
yum --nogpgcheck localinstall cloudera-cdh-5-0.x86_64.rpm -y
3.2 安装apache
3.3 安装yum-utils
yum install yum-utils createrepo -y
3.4 用yum-utils同步整个yum源
随便切换到一个文件夹,比方 home 文件夹把 可是确保你所在的文件夹有至少3G空间,然后运行
$ cd ~
$ reposync -r cloudera-cdh5
接下来可能是漫长的等待。取决于你的网络速度
这个命令运行完后会把整个cdh5的库(大概118个包)下载到这个文件夹下,大概2.3G
你会看到有一个叫 cloudera-cdh5 的目录生成,进入后有一个 RPMS 目录,里面有 noarch 和 x86_64 目录
[root@localhost ~]# cd cloudera-cdh5
[root@localhost cloudera-cdh5]# ll
total 4
drwxr-xr-x. 4 root root 4096 Dec 18 07:55 RPMS
[root@localhost cloudera-cdh5]# cd RPMS
[root@localhost RPMS]# ll
total 16
drwxr-xr-x. 2 root root 4096 Dec 18 16:07 noarch
drwxr-xr-x. 2 root root 12288 Dec 18 16:07 x86_64
高速下载诀窍:这边有一个诀窍。你開始运行 reposync 之后你会发如今运行这个命令的根文件夹会自己主动生成 cloudera-cdh5/noarch 文件夹,并開始下载包。
事实上我们能够直接用浏览器打开 http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/RPMS 你会看到有 noarch 和 x86_64 这两个文件夹,进入这两个文件夹。用迅雷把这些包所有下载下来,然后扔到centos的 cloudera-cdh5 文件夹下,再运行
reposync 命令,然后这些包会被一一检查,并被觉得已经下载好了。并跳过。
3.5 部署到apache
把这个cloudera-cdh5文件夹整个移到apache的web文件夹:/var/www/html 里面去,只是请先保证空间足够大,假设不够大。记得改动apache的web文件夹的位置,详细怎么改自己百度下
[root@localhost ~]# mv cloudera-cdh5 /var/www/html
[root@localhost ~]# cd /var/www/html
[root@localhost html]# ll
total 4
drwxr-xr-x. 3 root root 4096 Dec 18 07:49 cloudera-cdh5
用vim打开 /etc/httpd/conf/httpd.conf 查找到这句话
<Directory "/var/www/html">
这个节点里面的 Options 后面的文字改成 MultiViews
Options MultiViews
然后重新启动apache
service httpd restart
打开自己的浏览器试试看訪问这个地址
http://192.168.199.126/cloudera-cdh5/RPMS/noarch/whirr-0.9.0+cdh5.2.1+12-1.cdh5.2.1.p0.6.el6.noarch.rpm
ip改成你自己的机器的ip,假设浏览器自己主动開始下载这个文件的话。证明调通了
3.6 构建repo库
cd 到 /var/www/html/cloudera-cdh5 然后运行 createrepo . 进行构建
[root@localhost ~]# cd /var/www/html/cloudera-cdh5/
[root@localhost cloudera-cdh5]# createrepo .
3.7 改动yum源地址
分别把两台机器的/etc/yum.repos.d/cloudera-cdh5.repo 里面的 baseurl 改动为这台机器的地址。像我就改动成这样
[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://192.168.199.126/cloudera-cdh5/
gpgkey = http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
enabled=1
gpgcheck = 1
注意:採用这样的方式后,安装hadoop都将很的快。可是假设有时候不能正常安装,那么你还是能够启用远程地址,建议把下面两句话用注解方式保存在这个文件中面,当你认为可能本地库有问题,想切换为远程库的时候能够方便的切换。这个文件就变成这样
[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://192.168.199.126/cloudera-cdh5/
gpgkey = http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
#baseurl=http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/
#gpgkey = http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
enabled=1
gpgcheck = 1
当你要切换远程库的会后把上面两行 baseurl 和 gpgkey 凝视起来,以下的把凝视去掉,保存退出即可,yum会马上生效不须要做什么额外的操作。
0. 选择安装模式
有两种安装模式 HA 和 非HA
事实上MapReduce也有两种安装模式 1.0(MRv1) 和 2.0(YARN) 国外已经主要推广 2.0了。只是国内的非常多教程是依照1.0来写的,所以看教程的时候记得分辨一下看是否适合你。
只是我相信国内非常快也会跟上的。
我推荐使用2.0,我们的教程这边也使用2.0
hadoop有两种安装模式:非HA和HA模式,非ha仅仅是用来实验上手而已。真实环境用ha。可是ha环境配置比較复杂,easy被卡主,所以我们先用非HA模式上手一下,然后玩玩hdfs找找感觉,免得失去信心。然后再安装HA模式。所以我的教程会教你们装两次,第一次是非HA模式,第二次是HA模式,在安装HA模式之前最好换新的虚拟机,防止,之前的安装影响到新的安装
最新文章
- python基本图像操作与处理
- iOS -- 上传多张图片 后台(PHP)代码和上传一张的一样
- Android之线程终止
- Unreachable catch block for IOException. This exception is never thrown from the try statement body
- Linux教学辅助训练(第二阶段)
- stdarg.h头
- mysql进阶(二十六)MySQL 索引类型(初学者必看)
- 【学亮IT手记】Servlet的生命周期
- pycharm显示Unresolved reference
- VSCode的终端修改
- django之创建第4-2个项目-访问class类属性和类方法
- MySQL修改密码和忘记ROOT密码
- 使用截图工具FastStone Capture
- SQL Server 字符串合并
- ZOJ-2753
- win32 application怎么把结果输出到调试窗口
- ASP.NET动态网站制作(26)-- Ajax
- springmvc 学习笔记1
- ZK请求处理
- 绘制弧形:imagearc() 说明:三点钟的位置是起点(0度
热门文章
- RxJava操作符总结之过滤
- Laravel之队列
- 标准库Queue的实现
- vue-router push
- Singleton单例模式是最简单的设计模式,它的主要作用是保证在程序执行生命周期中,使用了单类模式的类仅仅能有一个实例对象存在。
- java精确除法计算,四舍五入 Java问题通用解决代码
- .NET CORE 2.0小白笔记(四):asp.net core输出中文乱码的问题
- Android开发之Conversion to Dalvik format failed问题解决
- PHP接收和发送XML数据(json也通用)
- vim与windows/linux之间的复制粘贴小结