sqoop只要安装到集群中的一台节点就可以了





1.上传sqoop到节点中





2.安装和配置

在添加sqoop到环境变量到/etc/profile中

将数据库连接驱动拷贝到$SQOOP_HOME/lib里

3.使用

第一类:数据库中的数据导入到HDFS上

sqoop import --connect jdbc:mysql://192.168.1.10:3306/dbTest --username root --password 123  --table trade_detail --columns 'id, account, income, expenses'

--username 数据库用户名

--password 密码

--table 要连接的数据表

--colunms 指定表中的列,要用引号

sqoop import --connect jdbc:mysql://192.168.1.10:3306/dbTest --username root --password 123  --table trade_detail --target-dir '/sqoop/td' --fields-terminated-by '\t'

--target-dir 指定输出路径

--fields-terminated-by 以指定的符号作为字段之间的分隔符

sqoop import --connect jdbc:mysql://192.168.1.10:3306/dbTest --username root --password 123  --table trade_detail --target-dir '/sqoop/td1' --fields-terminated-by '\t' -m 2

-m 2 指定启用几个map任务

sqoop import --connect jdbc:mysql://192.168.1.10:3306/dbTest --username root --password 123  --table trade_detail --where 'id>3' --target-dir '/sqoop/td2'

--where 增加where条件, 注意:条件必须用引号引起来

sqoop import --connect jdbc:mysql://192.168.1.10:3306/dbTest --username root --password 123 \

--query 'SELECT * FROM trade_detail where id > 2 AND $CONDITIONS' --split-by trade_detail.id --target-dir '/sqoop/td3'

--query 增加sql语句(使用 \ 将语句换行)

注意:如果使用--query这个命令的时候,需要注意的是where后面的参数,AND $CONDITIONS这个参数必须加上

而且存在单引号与双引号的区别,如果--query后面使用的是双引号,那么需要在$CONDITIONS前加上\即\$CONDITIONS

如果设置map数量为1个时即-m 1,不用加上--split-by ${tablename.column},否则需要加上



第二类:将HDFS上的数据导出到数据库中(不要忘记指定分隔符)

sqoop export --connect jdbc:mysql://192.168.8.120:3306/dbTest --username root --password 123 --export-dir '/td3' --table td_bak -m 1 --fields-terminated-by ','

最新文章

  1. Unsupported major.minor version 51.0解决办法
  2. js基础篇——原型与原型链的详细理解
  3. Android NDK 开发(二) -- 从Hlello World学起【转】
  4. C#操作Excel,对Sheet插入次序的控制 (有待完善)
  5. 瑞丽的SQL-基于窗体的排名计算
  6. 阿里云ECS被攻击
  7. LSI MegaCli 命令使用2
  8. js的严格模式详解
  9. 【CF245H】Queries for Number of Palindromes(回文树)
  10. [转]用python 10min手写一个简易的实时内存监控系统
  11. 这样入门asp.net core 之 静态文件
  12. python-Excel读取-合并单元格读取
  13. cytoscape.js
  14. protobuff 编译注意事项
  15. Linux下在root权限下临时使用其它用户运行命令
  16. perf之sched
  17. sql server中调用c#写的dll里的方法
  18. 3D引擎Axiom的选择与学习.
  19. DeepLearning (三) 预处理:主成分分析与白化
  20. ArcEngine几何变换中的策略模式

热门文章

  1. nginx、apache、tomcat的区别
  2. Oracle基础 10 表 table
  3. 取消SecureCRT的右击粘贴功能
  4. 关于 Notepad++ 崩溃之后正在编辑文件内容被清空的致命问题的补救措施
  5. MATLAB中的符号运算
  6. MATLAB求函数零点与极值
  7. crontab执行python报错原因总结
  8. spark技术热点问题互动问答2
  9. 原生js编写设为首页兼容ie、火狐和谷歌
  10. gcc与gdb的使用