Combiners的作用:

每一个map可能会产生大量的输出,combiner的作用就是在map端对输出先做一次合并,以减少传输到reducer的数据量。

combiner最基本是实现本地key的归并,combiner具有类似本地的reduce功能。如下例子:

如果不用combiner,那么,所有的结果都是reduce完成,效率会相对低下。使用combiner,先完成的map会在本地聚合,提升速度。

注意:Combiner的输出是Reducer的输入,Combiner绝不能改变最终的计算结果。所以从我的想法来看,Combiner只应该用于那种Reduce的输入key/value与输出key/value类型完全一致,且不影响最终结果的场景。比如累加,最大值等。

Partitioner编程:

自定义Partitioner,主要是想Reduce的结果能过根据key再次分类输出到不同文件夹中,结果能够直观,同时做到对数据结果的简单统计分析;

如下:

最新文章

  1. Debian-based Linux distributions 安装 virtualbox
  2. iOS开发数据库篇—SQLite的应用
  3. SAP HR宏 rp-provide-from-last
  4. codevs 1690 开关灯 线段树水题
  5. 转:VS中的路径宏 vc++中OutDir、ProjectDir、SolutionDir各种路径
  6. JSON对象(自定义对象)
  7. FastDFS分布文件系统[转]
  8. c#yield,IEnumerable,IEnumerator
  9. Linux 多线程串口通信
  10. Nopi Excel导入
  11. HDU 1069 I Think I Need a Houseboat(模拟)
  12. U盘为什么还有剩余空间,但却提示说空间不够
  13. AWT与Swing的区别
  14. html表单 2017-03-10PM
  15. Jmeter4.0+版本If Controller使用
  16. Java虚拟机垃圾收集器
  17. Fiddler 只取所需
  18. WEBBASE篇: 第七篇, JavaScript知识1
  19. 收藏的blog
  20. 在Web根目录下建立testdb.php文件内容

热门文章

  1. TopCoder SRM 559 Div 1 - Problem 900 CircusTents
  2. ●CodeForces 480E Parking Lot
  3. ●洛谷P2664 树上游戏
  4. 51nod 1364 最大字典序排列(线段树)
  5. make cmake gcc 间的关系
  6. [Luogu 1516] 青蛙的约会
  7. jquery easyui datagrid 设置设置在选中的所有行中只选择第一行
  8. 浅谈Trie树(字典树)
  9. NPOI给单元格加范围边框
  10. 微信小程序--试水