【Hadoop/Hive/mapreduce】系列之如何删除HIVE 表格的分区
2024-09-02 18:59:41
今天的一个业务场景就是要把三年的数据从第一天不停的融合起来,每一天作为表格一个新的分区。由于空间有限,数据量很大,可能每天数据都是几十个G的大小。所以我需要做的一点就是在融合这一天之后,删除一天的分区数据,为了保险起见,我删除这一天的前三天的数据。
大致代码是这样的
function shan(){
cat <<EOF
ALTER TABLE table_name DROP PARTITION (dt='$san');
EOF
}
first=20160706
second=20190310
while [ "$first" -le "$second" ]
do
zhong=`date -d "1 days ago ${first}" +%Y%m%d`
hive -e "`merge`" #这行代码就是在生成当天的数据融合
san=`date -d "3 days ago ${first}" +%Y%m%d`
hive -e "`shan`" #删除三天前的数据
let first=`date -d "-1 days ago ${first}" +%Y%m%d`
done
当然核心代码就是删除分区的那个代码
ALTER TABLE table_name DROP PARTITION (dt='$san');
最新文章
- 关于Java语言和面向对象记录
- Java中的序列化Serialable高级详解
- WEB压力测试工具Pylot试用
- [转]http://m635674608.iteye.com/blog/1750833
- 使用culr
- iphone Dev 开发实例8: Parsing an RSS Feed Using NSXMLParser
- JS函数式编程【译】2.1 函数式编程语言
- 在Mac OS X中使用VIM开发STM32(1)
- sitemap.xml 静态和动态生成页面 shopnc二次开发 动态生成sitemap.xml
- CentOS环境搭建(JDK安装、mysql安装、hadoop安装等)
- 高并发解决方案之Actor——第一节
- End up with More Teams UVA - 11088
- postgresql 自定义聚合函数
- java中异常的面试
- 哆啦A梦欺骗了你!浏览器CSS3测试遭质疑
- powerdesigner 字段添加注释和默认值
- 第18月第2天 ios博客
- Centos6.5使用yum安装svn
- noip第1课资料
- [webrtc] rtcp模块中rtt时间计算
热门文章
- Django auth组件拓展 关联外部信息---------------------------- Profile 模式
- php一种面向对象的语言,那么什么是面向对象呢?
- 移动端纯CSS3制作圆形进度条所遇到的问题
- linux文件按照行数切割
- [原创]Debian9 安装配置MariaDB
- 利用ASP.NET里自带的站点地图工具制作网站站点地图
- HCNA配置ssh远程登陆
- ListView、DataGrid 不显示列标题
- Ubuntu 18.04 一键安装深度截图工具 Deepin Screenshot
- 2017.9.21 HTML学习总结---多媒体播放系统设计