文件数目过多,会给HDFS带来压力,并且会影响处理效率,可以通过合并Map和Reduce的结果文件来消除这样的影响: set hive.merge.mapfiles = true ##在 map only 的任务结束时合并小文件 set hive.merge.mapredfiles = false ## true 时在 MapReduce 的任务结束时合并小文件 set hive.merge.size.per.task = 256*1000*1000 ##合并文件的大小 set mapred.m
从Linux转到Windowns后,发现很多好用的shell命令都没有了,但实际情况是Windows一样有DOS时代的命令窗口,在CLI年代用DOS的人也要干活. 比如,今天想将几个单独的sql文件整合到一起统一执行,在Linux上可以用cat来进行所有脚本的合并,于是在google上搜了一下windows cat,果然第一个就是stackoverflow上的答案. 我们可以使用type命令在cmd窗口里面实现文件合并,并且支持通配符. 使用方式如下: 指定文件名方式 type file1 fi