MapReduce案例运行及分词
首先查询进程,发现hadoop并没有启动
如何配置hadoop,参考我的另外一篇博文《Hadoop环境准备》
接下来,启动hadoop
start-all.sh
或者
start-dfs.sh
start-yarn.sh
启动成功后,在浏览器中输入:
<主机名>:8088
master:8088/cluster
a. Cluster Metrics
集群指标:app(提交、排队、运行、完成)、 Container个数 、 资源(内存、cpu)
b. Cluster Nodes Metrics
机器状态:active、dicommisioning、decommisioned、lost、unhealty、reboot
c. dr.who用户指标
通过浏览器访问默认使用dr.who用户
以上是基本情况说明,借来调用hadoop2.7/share/hadoop/mapreduce下的一个jar包:hadoop-mapreduce-exmaples-2.7.7.jar
执行jar包
hadoop jar hadoop-mapreduce-examples-2.7.7.jar
可以看到终端信息中出现wordcount信息
执行wordcount程序:
hadoop jar hadoop-mapreduce-examples-2.7.7.jar wordcount <input> <output>
调用wordcount分词程序,
hadoop jar hadoop-mapreduce-examples-2.7.7.jar wordcount file:/home/liuhongyang/Downloads/hadoop2.7/LICENCE.txt file:/home/liuhongyang/Downloads/hadoop2.7/tmp
说明:对LICENCE.txt文件进行分词,tmp文件输入output目录文件,新建前不应该存在
在tmp目录下查看结果:
最新文章
- multiple merge document
- java13
- windows 通过ssh连接到Linux主机
- post 405 method not allowed
- 为什么在Spring的配置里,最好不要配置xsd文件的版本号
- 表单验证插件——validate
- Modules you should know in Python Libray
- WCF—Binding
- HDU_1401——分步双向BFS,八进制乘权值压缩,map存放hash
- PHP字符串的编码问题(转)
- 【android】Android检查是否已经连接到网络
- 【转】Java保留固定小数位的4种方法
- Swift - 按钮(UIButton)的用法
- vim note(3)
- OpenStack最新版本Folsom架构解析
- 用getBoundingClientRect()来获取页面元素的位置
- C# WinForm DataGridView让DataPropertyName支持复杂属性
- [HNOI2013]消毒
- leetcode刷题笔记08 字符串转整数 (atoi)
- OO博客作业3:第9-11周作业总结