Sqoop操作集合
2024-08-25 10:38:09
1.在hive中建一个与mysql中一模一样的表
sqoop create-hive-table --connect jdbc:mysql://***.**.***.**:3306/数据库名称 --table 表名 --username root --password root --hive-partition-key 分区名称 --hive-table hive中的表名
2.在1完成后,自由导数到hive:
sqoop import --connect jdbc:mysql://***:3306/数据库 --username root --password root --query "SELECT * from hive_cc_daas_insurance_sales where pt=$value and \$CONDITIONS limit 1000" --target-dir /tmp/hive_cc_daas_insurance_sales --hive-table db_bi.hive_cc_daas_insurance_sales --hive-import --m 1 \
--hive-partition-key 分区名称 \
--hive-partition-value 分区值
其中
a.$CONDITIONS 是必须的,具体原理可以百度。
b.--target-dir /tmp/hive_cc_daas_insurance_sales 指的是从mysql中的数据放到hdfs的哪部分上(Sqoop导数mysql->hdfs->hive)
c.1中的--hive-partition-key必须和2中的hive-partition-key,hive-partition-value同时存在或不存在
d.--fields-terminated-by ',' mysql中的字段存储在HDFS上时,以,分割
3.如果导入到hive中到数据都是null(除了partition有数据),那么
把 --hive-drop-import-delims \
--fields-terminated-by '\001' \
删除了就行
最新文章
- laypage分页
- webpack如何与gulpfile联合的使用
- 《Java4android》视频学习笔记——面向对象的应用(一)
- Tomcat:使用JMX监管Tomcat的几种方式
- setAttribute()和getAttibute(),getParameter()
- Discuz 插件制作之后台常用函数详解
- Altium Designer /DXP无网络铺铜:
- iOS 2D绘图详解(Quartz 2D)之阴影和渐变(Shadow,Gradient)
- 判断IFeatureClass图形是否含有Z值信息,若有为IPoint赋Z值
- Codeforces 543C Remembering Strings(DP)
- Android(java)学习笔记222:开发一个多界面的应用程序之不同界面间互相传递数据(短信助手案例的优化:请求码和结果码)
- ListView OnItemClickListener position 索引不正确
- 5.4.2 RegExp实例方法
- Struts2自定义拦截器Interceptor以及拦截器登录实例
- Running R jobs quickly on many machines(转)
- python3: print()函数:def,end关键字介绍
- Java学习笔记(十七):构造器和setter方法选用
- go 包-锁机制
- Git 创建分支与合并分支
- php解析优酷网上的视频资源去广告
热门文章
- JavaScript设计模式-9.工厂模式
- springboot-21-maven多环境打包
- vue nextTick深入理解-vue性能优化、DOM更新时机、事件循环机制
- audio标签的自动播放(ios)
- SSIS教程:创建简单的ETL包 -- 6. 对项目部署模型使用参数(Using Parameters with the Project Deployment Model)
- 十二、curator recipes之双重屏障DoubleBarrier
- SSM迁移到Springboot记录
- 【SSH网上商城项目实战10】商品类基本模块的搭建
- HDU 2544(简单最短路)
- ARP原理和欺骗