val rdd= sc.parallelize(List(("tom",1),("jerry",3),("kitty",2),("tom",2)))
//1.根据传入的参数进行分组
val rdd1:RDD[(String, Iterable[(String, Int)])] =rdd.groupBy(_._1)
println(rdd1.collect.toBuffer)
//2.根据key进行分区(对KV形式是使用) -->除了指定分组之后分区的数量之外, 还可以使用自定义分区器
val rdd2: RDD[(String, Iterable[Int])] = rdd.groupByKey()
println(rdd2.collect.toBuffer)

  

最新文章

  1. BeanFactory vs ApplicationContext
  2. Java中常量小知识
  3. 01Spring_基本jia包的导入andSpring的整体架构and怎么加入日志功能
  4. DDL, DML不是所有SQL都是可以自动回滚的
  5. 性能测试之-wrk(转)
  6. 基于asp.net的Web开发架构探索
  7. Lattice Diamond安装
  8. 简易的highcharts公共绘图模块封装--基于.net mvc
  9. ora-01445 无法从不带保留关键字的表的联接视图中选择 ROWID 或采样
  10. 通过ssh訪问NAT网络模式虚拟机里的Linux
  11. HDU-5340 Three Palindromes(字符串哈希)
  12. Java NIO FileVisitor 高效删除文件
  13. installshield安装包制作
  14. Python之字典方法
  15. 【Spring】SpringMVC配置文件
  16. addEventListener以及滑轮滑动事件的应用
  17. Struts2验证框架_xml验证失败
  18. vsphere和vmware快照的不足之处
  19. (五)ROS节点
  20. CentOS vps下,安装xfce/KDE/GNOME桌面+vncserver进行远程管理

热门文章

  1. 【spring】spring aop
  2. Java异常相关知识总结
  3. 高效并发一 Java内存模型与Java线程(绝对干货)
  4. dtd的引入方式
  5. CTF必备技能丨Linux Pwn入门教程——环境配置
  6. SpringMVC 之 上传文件
  7. odoo12 权限配置1
  8. [PHP] substr占用内存谨慎使用
  9. docker容器网络—单主机容器网络
  10. NLP中的预训练语言模型(四)—— 小型化bert(DistillBert, ALBERT, TINYBERT)