sorted = order data by $0;

 
数值类型按照数值大小比较
chararray类型按照字符的字典顺序比较
bytearray按照字节的字典顺序比较
复杂类型(map、tuple、bag)不能比较
null是最小的
 
触发reduce阶段
sorted = order data by $0;
sorted = order data by $0 desc, $1 asc;

  

order by是全局排序,有reduce阶段,有可能产生数据倾斜,为解决这个问题,Pig在shuffle过程中使用了分割器,根据取样结果将数据相对均匀的分摊给reducer,这样产生的弊端是同一个排序键对应的数据有可能保存在不同的文件里。

最新文章

  1. 利用div实现遮罩层效果
  2. Hibernate中一对多和多对一关系
  3. Java Servlet(七):JavaWeb MVC 操作(jdk7+tomcat7+eclipse)
  4. Python十分钟学会
  5. 解决 ko mapping 数组无法添加新对象的问题
  6. selvert的过滤器filter处理中文乱码
  7. nginx 配置文件
  8. arcgis 获得路径和环境变量信息
  9. C#比较dynamic和Dictionary性能
  10. 【Android官方Training教程】Getting Started部分学习笔记
  11. Hadoop-2.7.2集群的搭建——集群学习日记
  12. tensorflow MNIST新手教程
  13. Android播放在线音乐文件
  14. Linux:Day18(上) dns服务基础进阶
  15. learning makefile ?=
  16. 复习centos7命令---vim常用
  17. Safecracker-HDU1015
  18. 不平衡学习 Learning from Imbalanced Data
  19. Git常用的命令
  20. Liberty Mutual Property Inspection, Winner's Interview: Qingchen Wang

热门文章

  1. 做了三年的菜鸟web前端的感悟
  2. java8时间类
  3. 命令行创建Android应用,命令行生成签名文件,命令行查看签名信息,对APK包签名并编译运行
  4. Flow类注释解读
  5. 数据库-转换sql语句
  6. C#正则表达式合并连续空格为单个空格
  7. ZOJ 1203 Swordfish(Prim算法求解MST)
  8. python26:自定义form表单验证
  9. BG.Sqoop
  10. 深入分析 Java 中的中文编码问题【转】