sortByKey函数作用于Key-Value形式的RDD,并对Key进行排序。

package com.test.spark
import org.apache.spark.{SparkConf, SparkContext} /**
* @author admin
* SortByKey:sortByKey对于key是单个元素排序很简单,
* 如果key是元组如(X1,X2,X3.....),它会先按照X1排序,若X1相同,则在根据X2排序,依次类推...
*/
object SparkSortByKeyApplication {
def main(args: Array[String]): Unit = {
val conf = new SparkConf().setMaster("local").setAppName("SortByKey-test")
val sc = new SparkContext(conf)
val arr = Array((1, 6, 3), (2, 3, 3), (1, 1, 2), (1, 3, 5), (2, 1, 2))
val rdd1 = sc.parallelize(arr)
// 设置元素(e1,e3)为key,value为原来的整体
val rdd2 = rdd1.map(e => ((e._1, e._3), e))
// 利用sortByKey排序的对key的特性
val rdd3 = rdd2.sortByKey()
val rdd4 = rdd3.values.collect
rdd4.foreach(println)
}
}

最新文章

  1. jmeter ForEach Controller学习
  2. Socket编程基础——Socket选项
  3. redis中模糊删除
  4. HW3.1
  5. “layout_”下划线开头的属性
  6. JQuery和原生JS跨域加载JSON数据或HTML。
  7. babel的使用详解
  8. 【莫比乌斯反演】BZOJ2005 [NOI2010]能量采集
  9. WPF 10天修炼 第三天- Application全局应用程序类
  10. if语句与switch语句
  11. LRU 算法
  12. css3 - 特性
  13. Logistic Regression Using Gradient Descent -- Binary Classification 代码实现
  14. Spring3.x错误----Bean named "txAdvice" must be of type[org.aopallibance.aop.Advice
  15. golang日志收集方案之ELK
  16. Linux 添加yum命令
  17. C11线程管理:原子变量&单调函数
  18. 流程控制--if条件
  19. PHP+phpMyAdmin编程插入数据显示中文乱码的问题
  20. JavaScript专题(二)闭包

热门文章

  1. p4 环境变量的优先级
  2. webbench进行压力测试
  3. [c#基础]ICloneable接口
  4. [Done]SnowFlake生成Long类型主键返回前台过长导致精度缺失的问题
  5. Adobe Photoshop CC2019中文破解版
  6. 谈谈MySQL死锁 一
  7. Tumblr 架构设计
  8. primary库新增数据文件后,standby库无法创建文件并终止数据同步
  9. system函数遇到的问题
  10. 使用RStudio远程连接MySQL