HIVE 数据分析
题目要求:
具体操作:
①hive路径下建表:sale
create table sale
(day_id String, sale_nbr String, buy_nbr String, cnt String, round String)
ROW format delimited fields terminated by ',' STORED AS TEXTFILE;
②导入数据:
load data local inpath '/opt/module/data/sales.csv' into table sale;
③数据清洗:
3、数据分析处理:
(1)统计每天各个机场的销售数量和销售金额。要求的输出字段 day_id,sale_nbr,,cnt,round 日期编号,卖出方代码,数量,金额。
命令:
查询语句:
select day_id,sale_nbr,sum(cnt),sum(round) from sale where sale_nbr like 'C%' group by day_id,sale_nbr;
创建表table1:
create table table1(day_id String,sale_nbr String, cnt String,round String) ROW format delimited fields terminated by ',' STORED AS TEXTFILE;
将查询语句保存至table1:
insert overwrite table table1 select day_id,sale_nbr,sum(cnt),sum(round) from sale where sale_nbr like 'C%' group by day_id,sale_nbr;
(2)统计每天各个代理商的销售数量和销售金额.要求的输出字段 day_id,sale_nbr,cnt,round 日期编号,卖出方代码,数量,金额
命令:
查询语句:
select day_id,sale_nbr,sum(cnt),sum(round) from sale where sale_nbr like 'O%' or buy_nbr like 'O%' group by day_id,sale_nbr;
创建表table2:
create table table2(day_id String,sale_nbr String, cnt String,round String) ROW format delimited fields terminated by ',' STORED AS TEXTFILE;
将查询结果保存至table2:
insert overwrite table table2 select day_id,sale_nbr,sum(cnt),sum(round) from sale where sale_nbr like 'O%' or buy_nbr like 'O%' group by day_id,sale_nbr;
(3)统计每天各个代理商的销售活跃度。 要求的输出字段 day_id,sale_nbr, sale_number 日期编号,卖出方代码,交易次数(买入或者卖出均算交易次数)
命令:
查询语句:
select day_id,sale_nbr,count(sale_nbr)from sale where sale_nbr like "O%" group by sale_nbr,day_id;
创建表table3:
create table table3(day_id String,sale_nbr String, sale_number String) ROW format delimited fields terminated by ',' STORED AS TEXTFILE;
将查询结果保存至表table3:
insert overwrite table table3 select day_id,sale_nbr,count(sale_nbr)from sale where sale_nbr like "O%" group by sale_nbr,day_id;
导入mysql:
一
1.建表(可视化建表):
2.sqoop路径下执行命令:
bin/sqoop export \
> --connect jdbc:mysql://master:3306/mysql \
> --username root \
> --password 000000 \
> --table table1\
> --num-mappers 1 \
> --export-dir /user/hive/warehouse/table1 \
> --input-fields-terminated-by ","
二
bin/sqoop export \
> --connect jdbc:mysql://master:3306/mysql \
> --username root \
> --password 000000 \
> --table table2\
> --num-mappers 1 \
> --export-dir /user/hive/warehouse/table2 \
> --input-fields-terminated-by ","
三
bin/sqoop export \
> --connect jdbc:mysql://master:3306/mysql \
> --username root \
> --password 000000 \
> --table table3\
> --num-mappers 1 \
> --export-dir /user/hive/warehouse/table3 \
> --input-fields-terminated-by ","
最新文章
- 腾讯网2016回响中国:华清远见荣获2016年度知名IT培训品牌
- WinServer远程部署系统(RDSystem)
- Java 线程同步
- linux shell脚本通过参数名传递参数值
- AVPlayer的使用本地视频
- js学习笔记一数字
- bzoj 1800: [Ahoi2009]fly 飞行棋 暴力
- C++头文件的包含顺序研究
- POJ 2350 Above Average
- html5 --基础笔记2
- 项目中引入composer
- Bzoj2946:[POI2000] 最长公共子串
- Redis的安装和部署
- PHP的Memcached简单实现
- 【转载】DQL、DML、DDL、DCL的概念与区别
- centos7破解安装fisheye和Crucible
- Visual Studio的安装应用及单元测试
- 利用Jquery和fullCalendar制作日程表
- RH318之域控服务器
- python基础(六)python操作excel
热门文章
- numpy入门—Numpy的核心array对象以及创建array的方法
- 使用el-tree-transfer的方式
- chrome插件one-read开发1:准备
- 《每周一点canvas动画》——圆周运动
- Android普通工具类获取Context
- 【Android开发】分割字符串工具类
- <;!--[if IE]>;<;style>;<;/style>;<;![endif]-->;
- int bool str
- Python 连接Mysql数据库执行语句操作
- [转载] Golang交叉编译(跨平台编译)简述