今天的一个业务场景就是要把三年的数据从第一天不停的融合起来,每一天作为表格一个新的分区。由于空间有限,数据量很大,可能每天数据都是几十个G的大小。所以我需要做的一点就是在融合这一天之后,删除一天的分区数据,为了保险起见,我删除这一天的前三天的数据。

大致代码是这样的

function shan(){
cat <<EOF
ALTER TABLE table_name DROP PARTITION (dt='$san');
EOF
} first=20160706
second=20190310 while [ "$first" -le "$second" ]
do
zhong=`date -d "1 days ago ${first}" +%Y%m%d`
hive -e "`merge`" #这行代码就是在生成当天的数据融合
san=`date -d "3 days ago ${first}" +%Y%m%d`
hive -e "`shan`" #删除三天前的数据
let first=`date -d "-1 days ago ${first}" +%Y%m%d`
done

当然核心代码就是删除分区的那个代码

ALTER TABLE table_name DROP PARTITION (dt='$san');

最新文章

  1. 关于Java语言和面向对象记录
  2. Java中的序列化Serialable高级详解
  3. WEB压力测试工具Pylot试用
  4. [转]http://m635674608.iteye.com/blog/1750833
  5. 使用culr
  6. iphone Dev 开发实例8: Parsing an RSS Feed Using NSXMLParser
  7. JS函数式编程【译】2.1 函数式编程语言
  8. 在Mac OS X中使用VIM开发STM32(1)
  9. sitemap.xml 静态和动态生成页面 shopnc二次开发 动态生成sitemap.xml
  10. CentOS环境搭建(JDK安装、mysql安装、hadoop安装等)
  11. 高并发解决方案之Actor——第一节
  12. End up with More Teams UVA - 11088
  13. postgresql 自定义聚合函数
  14. java中异常的面试
  15. 哆啦A梦欺骗了你!浏览器CSS3测试遭质疑
  16. powerdesigner 字段添加注释和默认值
  17. 第18月第2天 ios博客
  18. Centos6.5使用yum安装svn
  19. noip第1课资料
  20. [webrtc] rtcp模块中rtt时间计算

热门文章

  1. Django auth组件拓展 关联外部信息---------------------------- Profile 模式
  2. php一种面向对象的语言,那么什么是面向对象呢?
  3. 移动端纯CSS3制作圆形进度条所遇到的问题
  4. linux文件按照行数切割
  5. [原创]Debian9 安装配置MariaDB
  6. 利用ASP.NET里自带的站点地图工具制作网站站点地图
  7. HCNA配置ssh远程登陆
  8. ListView、DataGrid 不显示列标题
  9. Ubuntu 18.04 一键安装深度截图工具 Deepin Screenshot
  10. 2017.9.21 HTML学习总结---多媒体播放系统设计