hive分为CLI(command line)(用的比较多)

JDBC/ODBC-ThriftServer

hiveServer(hive -service hiveserver),JDBC访问,一个客户端连接数,需要建立pool池,内存损耗极大,容易内存溢出(数据量太大不用)

web gui(基本不用)

Metastore (存储字段信息和数据存储HDFS的信息)

Complier(编译器):对sql查询语句进行语意分析并通过metastore中查找表和分区的元信息,生成执行计划。

Optimizer(优化器):优化HQL

Executor(执行器):对生成的执行计划进行执行

hive -e ‘select * from dual’ 命令行执行(不进入hive command line) -i  “文件名”(add jar进行UDF的预先加载)

hive -f .sql(执行文件 不支持传递参数)

通过hive -e的封装成hiveF 可以传递无数参数

hive优化

架构层面:

1 合理利用结果集(查询后结果加以利用,常用复杂或者低效统计统一给出,避免上层作业过多计算)

2 合理利用表分区(静态分区和动态分区)

HQL语法层面

执行计划

Hive参数层面(全局)

太暴力,很少用,有时候会起到不错效果

技巧

分表(把大数据的表脱离一些数据独立成别的表)

Hadoop 负载主要是 CPU负载和IO负载

两者可以相互转化ex:压缩(把IO转化为CPU)

最新文章

  1. Provisioning Services 7.6 入门到精通系列之一:PVS前期规划
  2. MySQL备份学习
  3. swoole 安装
  4. Java中的观察者模式
  5. AspNetPager用法
  6. mybatis 详解(十)------ 逆向工程
  7. 使用Xshell+Xmanager远程监控jvisualvm
  8. LeetCode 119. Pascal's Triangle II (杨辉三角之二)
  9. 前端学习:html基础学习二
  10. [spring transaction],service实现类中非事务方法直接调用自身事务方法导致事务无效的原因
  11. 如何解决WebBrowser.DocumentCompleted事件的多次调用
  12. 为什么会出现Notice: Undefined index: submit in D:\xampp\htdocs\test.php on line 19
  13. Elastic 今日在纽交所上市,股价最高暴涨122%。
  14. 清理XFCE4卸载残留
  15. 卡尔曼滤波+单目标追踪+python-opencv
  16. 如何使squild服务只能使用自定义的端口号
  17. js获取iframe中的元素
  18. main函数中如何等待协程运行完毕
  19. android中LitePal的使用
  20. 56. Two Sum【easy】

热门文章

  1. JS图片加载失败显示默认图片
  2. SharePoint 沙盒解决方案 VS 场解决方案
  3. Julia中文教程资源.txt
  4. python视频教程:十分钟快速入门python
  5. poj1845 数论
  6. classPath
  7. 基于HTML5+CSS3的图片旋转、无限滚动、文字跳动特效
  8. Python入门(四,高级)
  9. Git ~ 管理修改 ~ Gitasd
  10. 7、C#基础整理(类)