hive对有特殊值null的数据倾斜处理
对有特殊值的数据倾斜处理
SET mapred.reduce.tasks=20;
SET hive.map.aggr=TRUE;
SET hive.groupby.skewindata=TRUE;
SET hive.optimize.skewjoin=TRUE;
set hive.auto.convert.join=false;
INSERT OVERWRITE TABLE HIS_RFD_SYMID_RESULT
PARTITION(tid='wcj01')
SELECT aa.MAC,aa.phoneNo,bb.member_type,bb.xx_mid
FROM
( SELECT mr.MAC,phoneNo FROM MAC_RFD_RESULT_VALUES mr WHERE mr.tid = 'wcj01') aa
LEFT OUTER JOIN
( SELECT mac,mobile,member_type,xx_mid
FROM member m
WHERE m.id >= 'wcj01' AND m.id <= 'wcj01}' AND m.mobile IS NOT NULL ) bb
ON CASE WHEN aa.phoneNo = 'null' THEN CONCAT(RAND(),'hive') WHEN aa.phoneNo IS NULL THEN CONCAT(RAND(),'hive') WHEN length(aa.phoneNo)= 0 THEN CONCAT(RAND(),'hive') ELSE aa.phoneNo END = bb.mobile;
<!--
set hive.fetch.task.conversion=more;
-->
最新文章
- jsp实现邮件的发送
- JS 常用验证REG
- OC基本数据存储方式
- javase基础复习攻略《五》
- 【温故而知新-Javascript】图片效果(图像震动效果、闪烁效果、自动切换图像)
- String类详解,StringBuffer
- ED/EP系列6《扩展应用》
- PHP的数据库 之 关闭问题
- win7下go web之revel
- android 性能測试iozone篇
- Linux下搭建ntp时间同步服务器
- 基于canvas和jsp的头像剪辑上传
- python字典的操作
- appium GUI介绍
- Redis应用之[限制访问频率]
- PHP5.5+ APC 安装
- Python知识点小记
- CS224d 单隐层全连接网络处理英文命名实体识别tensorflow
- android 读取本地json文件 解决显示乱码显示
- php 传变量到 js 文件