impala 中SQL的优化方法
2024-10-06 08:41:28
1.取流水表的数据时,如果是使用全部分区数据,不能从SA层数据取数,需要改从SH层取数,因为SH层为parquet存储,查询性能较好。
2.对于脚本中使用的临时表,如果存在以下情况需要进行统计表信息
1)本身数据量较大
2)需要和大量数据表进行关联
3)本身被较多次使用
3.对于重复使用计算的SQL,需要事前计算好数据,放到临时表中使用,节省计算资源消耗。
4.一段SQL尽量用最少left join等关联,可以多些SQL块来执行。
最新文章
- PHP的学习--RSA加密解密
- metaclass 常用方式
- jQuery事件绑定on()、bind()与delegate() 方法详解
- oop、try_except、单例模式
- 关于Unity中Camera的Aspect
- Channel 笔记本项目 (门户客户端(介绍1) 和 wp7客户端)
- Eclipse插件Target Management (RSE)
- Clojure学习01:开始起步
- 对于stackoverflow的中文翻译的相关问题
- 【转】android动画之Tween动画 (渐变、缩放、位移、旋转)
- JDBCTemplate
- 《Linux系统编程手册》读书笔记——第2章基本概念
- Flask入门之Jinjia模板的一些语法
- 接口压力测试--Jmeter
- [C#.Net]Window服务调用外部程序
- poj3070 单位矩阵(转移矩阵构造)+矩阵快速幂
- Ubuntu18.04 运行 Gradle 4.9
- SQL事务日志备份时的问题
- Yarn源码分析1(Hadoop2.7.2)
- Linux下MySQL数据库的备份与还原