Aws云服务EMR使用

创建表结构

创建abc库下的abc_user_i表字段s3://abc-server/abc-emr/shell/ABC_USER_HIVE.q:

  • EXTERNAL 指定为外部表
  • partitioned by (createTime Date) 指定分区表,列名createTime
  • LOCATION '${INPUT}' 指定输出位置
CREATE EXTERNAL TABLE IF NOT EXISTS abc.abc_user_i (
devId STRING,
appId INT ,
paName STRING,
appVersion STRING,
appVercode STRING,
sdkVersion STRING,
sdkVerCode STRING,
phoneVersion STRING,
mac STRING,
source STRING,
content STRING,
logDate Date,
ip STRING
)
partitioned by (createTime Date)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ':'
LOCATION '${INPUT}';

添加步骤创建表:

hive的操作

# 创建分区:

  • location 指定 存储文件的具体位置 按日期存储的压缩包文件
  • 分区一个目录对应一条分区表
alter table abc.abc_user_i add partition (createTime='2017-10-20') location 's3://abc-server/abc-emr/InputDate/2017-10-20/';
alter table abc.abc_user_i add partition (createTime='2017-10-20') location 's3://abc-server/abc-emr/InputDate/2017-10-21/';
alter table abc.abc_user_i add partition (createTime='2017-10-20') location 's3://abc-server/abc-emr/InputDate/2017-10-22/';

# 查询已经创建的分区:

show partitions abc.abc_user_i;
createtime=2017-10-20
createtime=2017-10-21
createtime=2017-10-22

# 根据分区 查询结果:

hive> select count(*),createTime from abc.abc_user_i where createTime='2017-10-01' group by createTime;
Query ID = hadoop_20171102062813_7cccccxxx-c311-411e-de30-1xxxxaaaaa4
Total jobs = 1
Launching Job 1 out of 1
Status: Running (Executing on YARN cluster with App id application_1508122225619_0272) ----------------------------------------------------------------------------------------------
VERTICES MODE STATUS TOTAL COMPLETED RUNNING PENDING FAILED KILLED
----------------------------------------------------------------------------------------------
Map 1 .......... container SUCCEEDED 1 1 0 0 0 0
Reducer 2 ...... container SUCCEEDED 1 1 0 0 0 0
----------------------------------------------------------------------------------------------
VERTICES: 02/02 [==========================>>] 100% ELAPSED TIME: 15.65 s
----------------------------------------------------------------------------------------------
OK
5404869 2017-10-01
Time taken: 17.211 seconds, Fetched: 1 row(s)

# 删除分区(外部表只会删除索引,不会删除数据;内部表会删除索引和数据):

alter table adsdk.adsdk_useraction_i drop partition(createTime='2017-10-24');

Hive创建外部表以及分区参考:

http://blog.csdn.net/csfreebird/article/details/27874943

最新文章

  1. C#设计模式系列:适配器模式(Adapter)
  2. 【转】Win7 64bit Oracle 11g 使用PL/SQL Developer 连接时提示“SQL*Net not properly installed”
  3. windows目录选择 文件选择 文件保存对话框
  4. ROM, RAM, Flash Memory
  5. 轮子来袭 vJine.Core Orm 之 01_快速体验
  6. Android UI开发第三十三篇——Navigation Drawer For Android API 7
  7. Windows phone 之Interaction.Triggers的使用
  8. javascrip 分享到
  9. QTP插入Output Value和插入CheckPoint,注意点
  10. HTML5 Canvas Text文本居中实例
  11. [FindBugs分析记录]Potentially dangerous use of non-short-circuit logic
  12. Unix/Linux环境C编程入门教程(4) Debian Linux环境搭建
  13. Plan : 破晓
  14. xcode配色方案 (自己常用的)
  15. MJExtension的使用
  16. 初识gauge自动化测试框架(二)
  17. win10 右下角显示秒
  18. Maximum Sum Circular Subarray LT918
  19. SQL Server 远程备份详解
  20. 大数据环境完全分布式搭建 hadoop2.4.1

热门文章

  1. 基本类型变量、引用类型变量的在java中的存放位置
  2. NOIP模拟赛10 题解
  3. Mudo C++网络库第四章学习笔记
  4. AviSynth AVS Importer Plugin for Adobe Premiere Pro CC 2015 x64
  5. ubuntu安装Qt
  6. 通过python统计nginx日志定位php网站响应慢的问题
  7. freeswitch反注册记录
  8. kali sudo apt install 无法定位软件包
  9. MySQL分组查询,前3条数据
  10. 将文字数字转阿拉伯数字(Python)