Hadoop完整搭建过程(一):本地模式
2024-09-07 22:10:01
1 本地模式
本地模式是最简单的模式,所有模块都运行在一个JVM
进程中,使用本地文件系统而不是HDFS
。
本地模式主要是用于本地开发过程中的运行调试用,下载后的Hadoop
不需要设置默认就是本地模式。
2 准备工作
笔者喜欢把JDK
放在/usr/local
下,运行前请确保设置了JAVA_HOME
,注意是在etc/hadoop/hadoop-env.sh
中设置:
tar -zxvf openjdk-11+28_linux-x64_bin.tar.gz
sudo mv openjdk-11+28_linux-x64_bin /usr/local/java
sudo vim HADOOP/etc/hadoop/hadoop-env.sh # HADOOP为Hadoop安装目录
# 输入
export JAVA_HOME=/usr/local/java
3 使用
官网关于该模式没有太多的描述,只有一个使用默认配置文件作为输入,然后匹配正则表达式作为输出的简单例子:
# HADOOP表示Hadoop安装目录
mkdir input
cp HADOOP/etc/hadoop/*.xml input
HADOOP/bin/hadoop jar HADOOP/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.0.jar grep input output 'dfs[a-z.]+'
cat output/*
从下图的id
可以看出是以本地模式工作的:
4 输出
输出文件夹output
有两个文件:
_SUCCESS
:是个空文件,表示运行成功part-r-00000
:输出结果文件,词数统计
part-r-00000
结果如上图所示。
实际上本地模式不需要特别的处理,因为默认就是本地模式。
5 参考
最新文章
- java 导出word 并下载
- zlog学习笔记(mdc)
- 64位MicrosoftOfficeWord加载EndnoteX7
- CF 9D. How many trees?(dp)
- 【转】Cordova文件传输插件fileTransfer
- cordova-plugin-unionpay
- OWIN规范中最让人费解的地方
- python数据结构之栈、队列的实现
- EXTJS 4.2 资料 控件之Grid 行编辑绑定下拉框,并点一次触发一次事件
- 【HTML XHTML CSS基础教程(第6版)】笔记之HTML XHTML笔记(1~6章)
- codeforces432D Prefixes and Suffixes(kmp+dp)
- UESTC_秋实大哥搞算数 2015 UESTC Training for Data Structures<;Problem N>;
- 精讚部落::MySQL 的MEMORY engine
- BIZTALK项目中WEB引用WEBSERVICES服务时候报错
- hdu_5680_zxa and set(想法题)
- 【G】开源的分布式部署解决方案(一) - 开篇
- ES6新特性 Class的实现
- [国嵌攻略][100][嵌入式Linux内核制作]
- jquery-能拖拽宽度的table
- IM系统的MQ消息中间件选型:Kafka还是RabbitMQ?