1.先在hive-site.xml中设置小文件的标准.

<property>
<name>hive.merge.smallfiles.avgsize</name>
<value>536870912</value>
<description>When the average output file size of a job is less than this number, Hive will start an additional map-reduce job to merge the output files into bigger files. This is only done for map-only jobs if hive.merge.mapfiles is true, and for map-reduce jobs if hive.merge.mapredfiles is true.</description>
</property>

2.为仅仅有map的mapreduce的输出并合并小文件.

<property>
<name>hive.merge.mapfiles</name>
<value>true</value>
<description>Merge small files at the end of a map-only job</description>
</property>

2.为含有reduce的mapreduce的输出并合并小文件.

<property>
<name>hive.merge.mapredfiles</name>
<value>true</value>
<description>Merge small files at the end of a map-reduce job</description>
</property>

最新文章

  1. Linux 下编译升级 Python
  2. js 两数相减
  3. python 正则表达式点号与&#39;\n&#39;符号的问题
  4. [转]--android studio 使用gradle 导出jar包,并打包assets目录
  5. BackgroundWorker
  6. 10.6 noip模拟试题
  7. java打jar包 命令行cmd在当前路径打jar包
  8. keyDown keyPress keyUp 事件的区别
  9. Vertica数据库操作
  10. .NET 基础 一步步 一幕幕[面向对象之堆、栈、引用类型、值类型]
  11. # webpack 3 &amp; React 的简单配置 。
  12. 社区发现算法 - Fast Unfolding(Louvian)算法初探
  13. 关于HttpSession 和 Hibernate框架中 session异同点的简单解析
  14. C字符串
  15. [加密]ESP32 -Secure Boot 安全方案
  16. Subversion权限详解
  17. 缓存(图像 IO 14.2)
  18. 雷林鹏分享:C# 属性(Property)
  19. Robotframework测试相关库的简单整理
  20. boost.sha1

热门文章

  1. springMVC3学习(六)--SimpleFormController
  2. TCP三次握手的过程
  3. BOOST 线程完全攻略 - 扩展 - 事务线程
  4. Sprite Kit编程指南(1)-深入Sprite Kit
  5. 基于ADODBX对数据库的CURD
  6. Linq:切勿使用 Count() &gt; 0 来判断集合非空
  7. RadioButton 和 RadioButtonList 比较
  8. Intellij Idea安装主题
  9. linux基础内容学习一:linux下的分区及安装
  10. RDLC添加链接