Hive 复习
2024-08-26 06:42:35
hive分为CLI(command line)(用的比较多)
JDBC/ODBC-ThriftServer
hiveServer(hive -service hiveserver),JDBC访问,一个客户端连接数,需要建立pool池,内存损耗极大,容易内存溢出(数据量太大不用)
web gui(基本不用)
Metastore (存储字段信息和数据存储HDFS的信息)
Complier(编译器):对sql查询语句进行语意分析并通过metastore中查找表和分区的元信息,生成执行计划。
Optimizer(优化器):优化HQL
Executor(执行器):对生成的执行计划进行执行
hive -e ‘select * from dual’ 命令行执行(不进入hive command line) -i “文件名”(add jar进行UDF的预先加载)
hive -f .sql(执行文件 不支持传递参数)
通过hive -e的封装成hiveF 可以传递无数参数
hive优化
架构层面:
1 合理利用结果集(查询后结果加以利用,常用复杂或者低效统计统一给出,避免上层作业过多计算)
2 合理利用表分区(静态分区和动态分区)
HQL语法层面
执行计划
Hive参数层面(全局)
太暴力,很少用,有时候会起到不错效果
技巧
分表(把大数据的表脱离一些数据独立成别的表)
Hadoop 负载主要是 CPU负载和IO负载
两者可以相互转化ex:压缩(把IO转化为CPU)
最新文章
- Provisioning Services 7.6 入门到精通系列之一:PVS前期规划
- MySQL备份学习
- swoole 安装
- Java中的观察者模式
- AspNetPager用法
- mybatis 详解(十)------ 逆向工程
- 使用Xshell+Xmanager远程监控jvisualvm
- LeetCode 119. Pascal's Triangle II (杨辉三角之二)
- 前端学习:html基础学习二
- [spring transaction],service实现类中非事务方法直接调用自身事务方法导致事务无效的原因
- 如何解决WebBrowser.DocumentCompleted事件的多次调用
- 为什么会出现Notice: Undefined index: submit in D:\xampp\htdocs\test.php on line 19
- Elastic 今日在纽交所上市,股价最高暴涨122%。
- 清理XFCE4卸载残留
- 卡尔曼滤波+单目标追踪+python-opencv
- 如何使squild服务只能使用自定义的端口号
- js获取iframe中的元素
- main函数中如何等待协程运行完毕
- android中LitePal的使用
- 56. Two Sum【easy】