前置条件

已经成功安装配置Hadoop和Mysql数据库服务器,如果将数据导入或从Hbase导出,还应该已经成功安装配置Hbase。

下载sqoop和Mysql的JDBC驱动

sqoop-1.2.0-CDH3B4.tar.gz :http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4.tar.gz

mysql-connector-java-5.1.28

安装sqoop

[hadoop@appserver ~]$ tar -zxvf sqoop-1.2.0-CDH3B4.tar.gz

配置环境变量

拷贝Hadoop核心包和MYSQL驱动包到sqooplib目录

[hadoop@appserver ~]$ cp hadoop-1.1.2/hadoop-core-1.1.2.jar sqoop-1.2.0-CDH3B4/lib/

[hadoop@appserver ~]$ cp  mysql-connector-java-5.1.28-bin.jar sqoop-1.2.0-CDH3B4/lib/

配置sqoop-1.2.0-CDH3B4/bin/configure-sqoop文件

注释掉hbase和zookeeper检查(除非准备使用HABASE等HADOOP组件)

启动hadoop集群

启动mysql

创建sqoop用户

建立sqoop库,test表,并构造测试数据

测试sqoop连接

[hadoop@appserver ~]$ sqoop list-databases --connect jdbc:mysql://10.120.10.11:3306/ --username sqoop --password sqoop

列出mysql中所有数据库的名称

从mysql导入到hdfs中

sqoop ##sqoop命令

import ##表示导入

--connect jdbc:mysql://ip:3306/sqoop ##告诉jdbc,连接mysql的url

--username sqoop ##连接mysql的用户名

--password sqoop ##连接mysql的密码

--table test ##从mysql导出的表名称

--fields-terminated-by '\t' ##指定输出文件中的行的字段分隔符

-m 1 ##复制过程使用1个map作业

[hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --fields-terminated-by ':' -m 1

Hadoop中查看导入结果

从hdfs导出到mysql中

sqoop

export ##表示数据从hive复制到mysql中

--connect jdbc:mysql://ip:3306/sqoop

--username sqoop

--password sqoop

--table test ##mysql中的表,即将被导入的表名称

--export-dir '/user/root/aa/part-m-00000' ##hive中被导出的文件

--fields-terminated-by '\t' ##hive中被导出的文件字段的分隔符

[hadoop@appserver ~]$ sqoop export --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --export-dir '/user/hadoop/test/part-m-00000' --fields-terminated-by ':' -m 1

Mysql中查看导出结果

从Mysql导入到Hbase中

参数说明:

Ø hbase_tablename指定要导成hbase的表名

Ø key_col_name指定mysql数据库表中哪一列作为hbase新表的rowkey

Ø col_fam_name是除rowkey之外的所有列的列族名

[hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --hbase-create-table --hbase-table mysql_sqoop_test --column-family info --hbase-row-key id -m 1

在Hbase中查看结果

转自:http://www.blogjava.net/redhatlinux/archive/2014/05/31/414291.html

最新文章

  1. 基于xml的Spring多数据源配置和使用
  2. linux系统meminfo详解(待补充)
  3. http://www.360doc.com/content/13/0516/22/12094763_285956121.shtml
  4. readLine读取socket流的时候产生了阻塞
  5. DELPHI相应鼠标滚轮
  6. hdu1698(线段树)
  7. Java数据结构与算法(1) - ch02有序表(OrderedArray)
  8. yii2 入口文件 提示syntax error, unexpected T_OBJECT_OPERATOR
  9. org.apache.xerces.dom.ElementNSImpl.setUserData(Ljava/lang/String;Ljava/lang
  10. 算法题思路总结和leecode继续历程
  11. javascript 获取用户当前 经纬度 位置
  12. linux查看硬盘详细信息
  13. MySQL分析数据运行状态【SHOW PROCESSLIST】
  14. 关于new Handler()与new Handler(Looper.getMainLooper())区别
  15. Python学习:20.Python网络编程(Socket)
  16. ThreadPoolExecutor之三:自定义线程池-扩展示例
  17. Java函数的联级调用
  18. HDU 3726 Graph and Queries treap树
  19. STL源代码剖析 容器 stl_map.h
  20. apaache php 日记设计

热门文章

  1. byte,bitmap,image互转
  2. 显示实时日期时间(html+js)
  3. CentOS系统识别NTFS分区的移动硬盘
  4. MVC 异步请求
  5. 获取或者设置时,无后缀和A后缀和W后缀的区别
  6. SD卡驱动分析(一)
  7. HTML基础 整理
  8. UVA 11795 七 Mega Man's Mission
  9. 借助Nodejs在服务端使用jQuery采集17173游戏排行信息
  10. which、whereis、locate、find 命令用法