题目要求:

具体操作:

①hive路径下建表:sale

create table sale

(day_id String, sale_nbr String, buy_nbr String, cnt String, round String)

ROW format delimited fields terminated by ',' STORED AS TEXTFILE;

②导入数据:

load data local inpath '/opt/module/data/sales.csv' into table sale;

③数据清洗:

3、数据分析处理:

(1)统计每天各个机场的销售数量和销售金额。要求的输出字段 day_id,sale_nbr,,cnt,round 日期编号,卖出方代码,数量,金额。

命令:

查询语句:

select day_id,sale_nbr,sum(cnt),sum(round) from sale where sale_nbr like 'C%' group by day_id,sale_nbr;

创建表table1:

create table table1(day_id String,sale_nbr String, cnt String,round String) ROW format delimited fields terminated by ',' STORED AS TEXTFILE;

将查询语句保存至table1:

insert overwrite table table1 select day_id,sale_nbr,sum(cnt),sum(round) from sale where sale_nbr like 'C%' group by day_id,sale_nbr;

(2)统计每天各个代理商的销售数量和销售金额.要求的输出字段 day_id,sale_nbr,cnt,round 日期编号,卖出方代码,数量,金额

命令:

查询语句:

select day_id,sale_nbr,sum(cnt),sum(round) from sale where sale_nbr like 'O%' or buy_nbr like 'O%' group by day_id,sale_nbr;

创建表table2:

create table table2(day_id String,sale_nbr String, cnt String,round String) ROW format delimited fields terminated by ',' STORED AS TEXTFILE;

将查询结果保存至table2:

insert overwrite table table2 select day_id,sale_nbr,sum(cnt),sum(round) from sale where sale_nbr like 'O%' or buy_nbr like 'O%' group by day_id,sale_nbr;

(3)统计每天各个代理商的销售活跃度。 要求的输出字段 day_id,sale_nbr, sale_number 日期编号,卖出方代码,交易次数(买入或者卖出均算交易次数)

命令:

查询语句:

select day_id,sale_nbr,count(sale_nbr)from sale where sale_nbr like "O%" group by sale_nbr,day_id;

创建表table3:

create table table3(day_id String,sale_nbr String, sale_number String) ROW format delimited fields terminated by ',' STORED AS TEXTFILE;

将查询结果保存至表table3:

insert overwrite table table3 select day_id,sale_nbr,count(sale_nbr)from sale where sale_nbr like "O%" group by sale_nbr,day_id;

导入mysql:

1.建表(可视化建表):

2.sqoop路径下执行命令:

bin/sqoop export \

> --connect jdbc:mysql://master:3306/mysql \

> --username root \

> --password 000000 \

> --table table1\

> --num-mappers 1 \

> --export-dir /user/hive/warehouse/table1 \

> --input-fields-terminated-by ","

bin/sqoop export \

> --connect jdbc:mysql://master:3306/mysql \

> --username root \

> --password 000000 \

> --table table2\

> --num-mappers 1 \

> --export-dir /user/hive/warehouse/table2 \

> --input-fields-terminated-by ","

bin/sqoop export \

> --connect jdbc:mysql://master:3306/mysql \

> --username root \

> --password 000000 \

> --table table3\

> --num-mappers 1 \

> --export-dir /user/hive/warehouse/table3 \

> --input-fields-terminated-by ","

最新文章

  1. 腾讯网2016回响中国:华清远见荣获2016年度知名IT培训品牌
  2. WinServer远程部署系统(RDSystem)
  3. Java 线程同步
  4. linux shell脚本通过参数名传递参数值
  5. AVPlayer的使用本地视频
  6. js学习笔记一数字
  7. bzoj 1800: [Ahoi2009]fly 飞行棋 暴力
  8. C++头文件的包含顺序研究
  9. POJ 2350 Above Average
  10. html5 --基础笔记2
  11. 项目中引入composer
  12. Bzoj2946:[POI2000] 最长公共子串
  13. Redis的安装和部署
  14. PHP的Memcached简单实现
  15. 【转载】DQL、DML、DDL、DCL的概念与区别
  16. centos7破解安装fisheye和Crucible
  17. Visual Studio的安装应用及单元测试
  18. 利用Jquery和fullCalendar制作日程表
  19. RH318之域控服务器
  20. python基础(六)python操作excel

热门文章

  1. numpy入门—Numpy的核心array对象以及创建array的方法
  2. 使用el-tree-transfer的方式
  3. chrome插件one-read开发1:准备
  4. 《每周一点canvas动画》——圆周运动
  5. Android普通工具类获取Context
  6. 【Android开发】分割字符串工具类
  7. <!--[if IE]><style></style><![endif]-->
  8. int bool str
  9. Python 连接Mysql数据库执行语句操作
  10. [转载] Golang交叉编译(跨平台编译)简述