1、准备文件并设置编码格式为UTF-8并上传Linux

2、新建一个Java Project

3、导入jar

4、编写Map()和Reduce()

5、将代码输出成jar

6、在linux中启动hdfs

7、修改两个配置文件

8、在linux中启动yarn

9、运行mapReduce

10、查看运行结果

1、 准备文件并设置编码格式为UTF-8并上传Linux

1)设置编码:首先打开文件点击左上角 文件(F) 点击另存为并将编码(E)设置为UTF-8 然后保存(S)替换的原来的文件

2)用工具将文件上传就Linux

3)将文件上传至HDFS

2、 新建一个Java Project

JDK必须是1.7版本以后的否则不支持

3、 导入jar

导入好多jar包并Add to Build Path

4、 编写Map()和Reduce()

5、将代码输出成jar

1) 将代码输出成jar

 

2) 将生成的jar上传至Linux

6、在linux中启动hdfs

1) 启动hdfs

1) 将text文件上传到HDFS

7、修改两个配置文件

在<configuration>配置项中增加以下内容:

<configuration>

        <property>

                <name>mapreduce.framework.name</name>

                <value>yarn</value>

        </property>

</configuration>

在<configuration>配置项中增加以下内容:

(参数解释:NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运MapReduce程序)

<configuration>

        <property>

                <name>yarn.nodemanager.aux-services</name>

                <value>mapreduce_shuffle</value>

        </property>

</configuration>

8、在linux中启动yarn

9、运行mapReduce

10、查看运行结果

最新文章

  1. 分布式文件系统 - FastDFS 简单了解一下
  2. NSURLConnection实现文件上传和AFNetworking实现文件上传
  3. JS 字符串
  4. PYTHON 内置函数
  5. 学习微信小程序之css10外边距
  6. Gradle常用命令
  7. 安装Docker Toolbox后出现的问题
  8. 安全模式下运行Windows installer并卸载程序
  9. 整理一下Entity Framework的查询
  10. GC之七--gc日志分析工具
  11. wmi详解,RPC和防火墙
  12. HDU 3487 Play with Chain(Splay)
  13. Mac系统下下删除加锁文件方法|使用终端命令强制清除废纸篓中的文件
  14. 《MySQL必知必会》[02] 多表联合查询
  15. NodeJs之数据库异常处理
  16. Python接口自动化测试 HTTP协议
  17. sololearn的c++学习记录_4m11d
  18. Spark学习之在集群上运行Spark
  19. java中的定时任务小示例
  20. NET设计模式 第二部分 创建型模式(4):工厂方法模式(Factory Method)

热门文章

  1. linux加域退域
  2. Redis-CentOS7安装
  3. 17.并发容器之ThreadLocal
  4. 1-15-2-RAID5 企业级RAID磁盘阵列的搭建(RAID1、RAID5、RAID10)
  5. 让你的ansible飞起来
  6. vue-router防跳墙控制
  7. (转)一行代码解决各种IE兼容问题,IE6,IE7,IE8,IE9,IE10
  8. spring项目加载不出来静态资源
  9. 网络编程的基本概念,TCP/IP协议简介
  10. Chrome自定义最小字号