将set hive.limit.optimize.enable=true 时,limit限制数据时就不会全盘扫,而是根据限制的数量进行抽样。

同时还有两个配置项需要注意:

1、hive.limit.row.max.size    我理解这个是控制最大的抽样数量

2、 hive.limit.optimize.limit.file 我理解这个是抽样的最大文件数量

最新文章

  1. iOS 正确选择图片加载方式
  2. ContentProvider备份短信,以xml文件存储
  3. ppDelegate的相关介绍
  4. linux服务之openldap
  5. phplib template说明
  6. Qt 之 show,hide,setVisible,setHidden,close 等小结
  7. Python开发环境Wing IDE使用教程:部分调试功能介绍
  8. python的模块!
  9. windows平台安装并使用MongoDB
  10. Elasticsearch安装使用
  11. snmp简单测试
  12. 初学Java必写的小程序。
  13. [C#]Socket通信BeginReceive异步接收数据何时回调Callback
  14. 【CDH学习之三】CDH安装
  15. hdu 5003 模拟水题 (2014鞍山网赛G题)
  16. 选中TreeView的某节点,并加背景颜色
  17. django模板语言转义处理
  18. web前端----JavaScript(JS)函数
  19. [转]XSS的原理分析与解剖:第四章(编码与绕过)
  20. Spring Boot 学习资料【m了以后看】(转)

热门文章

  1. gdb调试多进程和多线程命令
  2. Linux 下的另一个密码破解工具medusa
  3. 最诡异的Linux fork进程问题(我们平时都在写)
  4. <转>错误 x error LNK1104: 无法打开文件“E:\xxxx\Debug\xxxx.exe”
  5. 悦动达人 (多维dp)
  6. CSS包含块containing block详解
  7. 第18章 使用MariaDB数据库管理系统
  8. 搭建Nginx+JAVA环境
  9. 三款SDR平台对比:HackRF,bladeRF和USRP
  10. 阿里云服务器配置 SVN 服务器与生产站点同步