Hive导入导出数据的方法
Hive导入数据的方式
官网文档:
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]
local参数为原始文件存储的位置,位置可以是
- 本地local
- hdfs文件系统
overwrite参数
- 使用时会将表中的数据覆盖
- 不使用会在表中追加数据
partition参数为分区表加载
eg:
加载本地文件到hive表中
load data local inpath '/opt/datas/emp.txt' into table default.emp;
加载hdfs文件到hive表中
load data inpath '/user/user1/hive/datas/emp.txt' into table default.emp;
加载数据覆盖表中已有的数据
load data local inpath '/opt/datas/emp.txt' overwrite into table default.emp;
创建表时通过insert加载
create table default.emp_ci like emp;
insert into table default.emp_ci select * from default.emp;
创建表的时候通过location指定加载
...
Hive导出数据的方式
第一种,导出在本地文件中
insert overwrite local directory '/opt/datas/hive_exp_emp' select * from default.emp;
直接导出会有乱码,根据原有的表结构进行导出
insert overwrite local directory '/opt/datas/hive_exp_emp'
row format delimited fields terminated by '\t'
collection items terminated by '\n'
select * from default.emp;
注:
row format delimited fields terminated by '\t'
collection items terminated by '\n'
每行中的数据以\t隔开,每行数据以\n结束。
第二种,导出在本地文件中
bin/hive -e "select * from default.emp;" > /opt/datas/exp_res.txt
第三种,导出在hdfs文件系统中
insert overwrite directory '/user/user1/hive/hive_exp_emp' select * from default.emp;
最新文章
- AutoResetEvent ManualResetEvent WaitOne使用注意事项
- MySQL 临时表
- SpringMVC 返回json
- DropZone
- 转:JavaScript中的this陷阱的最全收集
- Android开发中的问题及相应解决(持续更新)
- Codeforces 424A (思维题)
- Struts2配置拦截器,struts2加载常量时的搜索顺序
- TreodeDB测试及总结
- mac下wget用来仿站
- zoj-3795-Grouping-tarjan确定最长的公路收缩
- SQL语句创建access表
- jQuery.Ajax IE8,9 无效(CORS跨域)
- Error: listen EADDRINUSE :::3000
- VRay(一)材质基础
- zookeeper客户端命令详解
- [转]VS2013+简单稀疏光束调整库SSBA配置(64位编译)
- 枚举1--求小于n的最大素数
- OC Copy自定义类
- 学习博客之Java继承多态接口
热门文章
- PO,BO,VO和POJO的区别
- NLP大赛冠军总结:300万知乎多标签文本分类任务(附深度学习源码)
- Mybaits配置多个数据库操作sql环境
- 刃边法计算MTF(ESF、LSF、PSF)
- python读取文件时遇到非法字符的处理 UnicodeDecodeError: 'gbk' codec can't decode bytes in position
- flask环境布署--废弃不用,只留作备份
- 设计模式(5): vue 不监听绑定的变量
- C#程序自动安装数字证书
- 郝斌_GUI
- visual studio 的 code snippet(代码片段)