大数据学习之路又之从csv文件到sql文件的操作过程
根据前几天的测试,简单的做个总结
csv文件的字段说明:
1.将csv文件上传到虚拟机中
在SecureCRT中点击,创建目录,直接把文件从本地拖拽进去
我放在了/linmob/data的路径下,所以文件的位置是/linmob/data/sales_sample_20170310.csv
2.在hive命令行中建表,表名要与csv文件中的一一对应,人生建议字段类型都选择varchar
hive
create table sales_sample_20170310(day_id varchar(30),sale_nbr varchar(30),buy_nbr varchar(30),cnt varchar(30),round varchar(30)) row format delimited fields terminated by ',' ;
3.导入数据 其中的路径 '/linmob/data/sales_sample_20170310.csv'和表名 sales_sample_20170310要修改成自己的
load data local inpath '/linmob/data/sales_sample_20170310.csv' overwrite into table sales_sample_20170310;
4.select验证数据是否导入,因为数据量大,一定要limit
select * from sales_sample_20170310 limit 10;
5.退出hive命令行,进入mysql,建表
exit;
mysql -uroot -proot
create table sales_sample_20170310(day_id varchar(30), sale_nbr varchar(30),buy_nbr varchar(30),cnt varchar(30),round varchar(30))charset utf8 collate utf8_general_ci;
6.退出mqsql,进入sqoop的bin目录下,到出数据到mysql数据库中,其中ip地址192.168.111.100、mysql数据库名tab、mysql用户名和密码root、mysql表名 sales_sample_20170310、hive路径名 /user/hive/warehouse/sales_sample_20170310都要换成自己的
hive路径名不清楚?到9870可以找到
./sqoop export --connect "jdbc:mysql://192.168.111.100:3306/tab?characterEncoding=UTF-8" --username root --password root --table sales_sample_20170310 --export-dir /user/hive/warehouse/sales_sample_20170310 --input-null-string "\\\\N" --input-null-non-string "\\\\N" --input-fields-terminated-by "," --input-lines-terminated-by "\\n" -m 1
7.数据导出
最新文章
- $q -- AngularJS中的服务(理解)
- sql server 中xml 数据类型的insert、update、delete
- Evolutionary Computing: 4. Review
- JavaScript常用事件
- (转)Monte Carlo method 蒙特卡洛方法
- C++学习7 构造函数
- Android(java)学习笔记120:Android中的Application类用法
- jquery checkbox 操作
- FlashPlayer11 异步解码 Bitmap
- js前端获取页面传递的参数
- fscanf和fprintf
- [POJ1631] nlogn求LIS
- servlet什么时候被实例化?【转】
- 配置frp
- Python图表数据可视化Seaborn:4. 结构化图表可视化
- MySQL到底能支持多大的数据量?
- layer弹出框确定前验证:弹出消息框(弹出两个layer)
- php环境搭建及入门
- springboot activiti关闭验证自动部署
- 软件-分布式:Kylin (apache开源分布式分析引擎软件)
热门文章
- LeetCode-040-组合总和 II
- MySQL [ERROR] [MY-013183]
- PHP防止订单超卖,秒杀,限购,PHP高并发防止超卖代码实践
- Java IDE的历史变迁及idea的使用
- Azure DevOps (四) 创建第一条流水线
- 什么是CSRF跨站请求伪造?(from表单效验csrf-ajdax效验csrf-Ajax设置csrf-CBV装饰器验证csrf)
- mybatis连接sql
- OOS 预览报错解决思路
- 题解0007:小木棍(P1120)
- 为什么redis 需要把所有数据放到内存中?