BulkLoad加载文件到HBase表

1、功能

将本地数据导入到HBase中

2、原理

BulkLoad会将tsv/csv格式的文件编程hfile文件,然后再进行数据的导入,这样可以避免大量数据导入时造成的集群写入压力过大。

1、tsv格式的文件:字段之间以制表符\t分割
2、csv格式的文件:字段之间以逗号,分割

3、作用

  1. 减小HBase集群插入数据的压力
  2. 提高了Job运行的速度,降低了Job执行时间

4、案例

Step1、配置临时环境变量

$ export HBASE_HOME=/opt/modules/cdh/hbase-0.98.6-cdh5.3.6/
$ export HADOOP_HOME=/opt/modules/cdh/hadoop-2.5.0-cdh5.3.6
$ export HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase mapredcp`

Step2、创建一个新的HBase表

$ bin/hbase shell

hbase(main):001:0> create 'fruit_bulkload','info'

Step3、将tsv/csv文件转化为HFile (别忘了要确保你的fruit格式的文件fruit.tsv在input目录下)

$ /opt/modules/cdh/hadoop-2.5.0-cdh5.3.6/bin/yarn jar \

/opt/modules/cdh/hbase-0.98.6-cdh5.3.6/lib/hbase-server-0.98.6-cdh5.3.6.jar importtsv \

-Dimporttsv.bulk.output=/output_file \

-Dimporttsv.columns=HBASE_ROW_KEY,info:name,info:color \

fruit hdfs://hadoop-senior01.itguigu.com:8020/input_fruit

Step4、把HFile导入到HBase表fruit_bulkload

上一步完成之后,你会发现在HDFS的根目录下出现了一个output_file文件夹,里面存放的就是HFile文件,紧接着:把HFile导入到HBase表fruit_bulkload

$ /opt/modules/cdh/hadoop-2.5.0-cdh5.3.6/bin/yarn jar \

/opt/modules/cdh/hbase-0.98.6-cdh5.3.6/lib/hbase-server-0.98.6-cdh5.3.6.jar \

completebulkload /output_file fruit_bulkload

Step5、查看使用bulkLoad方式导入的数据

hbase(main):001:0> scan ‘fruit_bulkload’

  

最新文章

  1. xp操作系统下配置iis,出现了server application error的解决办法
  2. 版本管理工具SVN
  3. Activiti系列:如何让Activiti-Explorer使用sql server数据库
  4. centerOS安装rkhunter
  5. wordpress教程之get_posts()
  6. APP漏洞导致移动支付隐患重重,未来之路怎样走?
  7. 列表类型转换(ConvertList<TSource, TResult>)
  8. B/S和C/S【转载Jane的博客 http://blog.sina.com.cn/liaojane】
  9. 安装Redis无错流程
  10. java 工作内存
  11. 团队作业4——第一次项目冲刺(Alpha版本)第一天 and 第二天
  12. Cordic算法——圆周系统之向量模式
  13. pythonseleniumAPI
  14. Tomcat线程池配置
  15. CodePad系列之-Tkinter窗体
  16. wxpython安装,demo下载
  17. 每日英语:Nelson Mandela Dies at 95
  18. 手机e.pageX和e.pageY无效的原因
  19. Font Awesome使用简介
  20. linux文件类型详解

热门文章

  1. 升级ceph
  2. 旋转屏幕导致Activity重建问题的解决办法
  3. 如何在程序中执行动态生成的Delphi代码
  4. js与android原生交互
  5. ArcGIS Runtime SDK for .NET (Quartz Beta)之连接ArcGIS Portal
  6. C语言中#和##的作用
  7. JAVA StringUtils方法全集
  8. 【转】理解JMX之介绍和简单使用
  9. Cocos2d-x的Android配置以及相关参考文档
  10. Unity应用怎么暂停(Pause)