def seq(a:Int, b:Int) : Int ={
math.max(a,b)
} def comb(a:Int, b:Int) : Int ={
a + b
} val data = sc.parallelize(List((1,3),(1,2),(1, 4),(2,3))) data.aggregateByKey(3,4)(seq, comb).collect

输出结果是:

Array((1,10), (2,3))

参数"3"代表做比较的初始值,参数"4"代表并行化分区的数量。

参数seq代表与初始化值比较的函数。  参数comb是进行合并的方法。

将这个测试程序拿文字做一下描述就是:在data数据集中,按key将value进行分组合并,合并时在seq函数与指定的初始值3进行比较,保留大的值;然后在comb中来处理合并的方式。

最新文章

  1. Enterprise Solution 开源项目资源汇总 Visual Studio Online 源代码托管 企业管理软件开发框架
  2. 【leetcode】Pascal's Triangle II
  3. Photo Shop切图
  4. RMI的概念
  5. 用Canvas玩3D:点-线-面
  6. C#中Application.DoEvents()的作用
  7. object
  8. (转)Fibonacci Tilings
  9. k序数组排序
  10. Javascript 探路
  11. Girls' research - HDU 3294 (Manacher处理回文串)
  12. Facebook HHVM 和 Hack 手册----1.什么是Hack?
  13. VS2008编译汇编程序的问题
  14. 201521123003《Java程序设计》第8周学习总结
  15. mysql 证明为什么用limit时,offset很大会影响性能
  16. safari打开的页面数字识别变为蓝色
  17. Solr7.1--- 高亮查询
  18. IDEA配置maven(配置阿里云中央仓库)
  19. Linux 开机启动图形界面,shell界面
  20. 合并ts到mp4

热门文章

  1. ftp (文件传输协议)
  2. centOS6.4 extundelete工具恢复rm -rf 删除的目录
  3. Node.js 究竟是什么
  4. Zhulina 的高分子刷理论
  5. Hadoop日记Day1---Hadoop介绍
  6. [Effective JavaScript 笔记]第48条:避免在枚举期间修改对象
  7. [Effective JavaScript 笔记]第6章:库和API设计--个人总结
  8. django-jinjia 集成
  9. C语言 单引号和双引号的区别
  10. Android 中“TabBar”的背景拉伸问题