HBASE操作:(一般先合并region然后再压缩)

一 、Region合并: merge_region   'regionname1','regionname2' ,'true'  --true代表强制合并,一般要加上

一般要是将小文件根据配置的最大上限进行合并,合并后最好清理一下hdfs

二、Region 压缩:

我们以test表为例:

我们先创建一张不含任何压缩格式的test表,并且向其导入10多G的数据
$ hadoop fs -du -h /hbase/data/default/    --查询region的文件大小
12.2 G /hbase/data/default/test

我们可以看到,在未压缩之前,test表的数据在hdfs上一共占用了12.2G的磁盘空间。
1. disable test表:

hbase> disable 'test'

修改压缩格式:

2. hbase> alter 'test', NAME => 'c', COMPRESSION => 'snappy'
需要注意的是,修改压缩格式时,必须一个列族一个列族的改。

3. enable test表:

hbase> enable 'test'

enable之后,还需要做一次大合并才能让压缩格式生效:

4.  hbase> major_compact 'test'
需要注意的是,千万不要在表繁忙期间执行大合并操作。
describe test表看一下有没有生效

还是很可观的大概可以减少原来两倍左右的空间占用

      

最新文章

  1. php json_encode数据格式化
  2. Ajax服务请求原理 简单总结
  3. iOS 注释的5要3不要和编码规范的26个方面
  4. db2查询锁表
  5. java.util.ArrayList
  6. Top 100 words for advanced learners.
  7. Main function
  8. hdu 2859 (二维dp)
  9. win10快捷键大全
  10. 玩转zookeeper命令
  11. adb devices 找不到设备的解决方法
  12. layer[申明:来源于网络]
  13. Redis无法启动
  14. IOException parsing XML document from class path resource [WebRoot/WEB-INF/applicationContext.xml];
  15. 解决linux下访问https站点问题
  16. 在 JS 对象中使用 . 和 [] 操作属性的区别
  17. sklearn学习_01
  18. layer.alert自定义关闭回调事件
  19. [JSBSim]基于winsocket2的TCP\UDP使用例子
  20. 微信小程序日记(一)

热门文章

  1. 前端css常用class命名id命名
  2. strman--java8字符串工具类
  3. mybatis实战教程三:多对多关联
  4. java事件处理机制
  5. tp5命令行基础
  6. 企业级Docker私有仓库之Harbor部署(http)
  7. Win10图片打开方式没有“Windows照片查看器”,如何找回?
  8. mysql SQL语法总结
  9. C#之DataTable转List与List转Datatable
  10. MOBA 游戏技能系统设计 2.0