[Hive_add_3] Hive 进行简单数据处理
2024-08-30 11:03:40
0. 说明
通过 Hive 对 duowan 数据进行简单处理
1. 操作流程
1.1 建表
create table duowan(id int, name string, pass string, mail string, nickname string)
row format delimited
fields terminated by '\t'
lines terminated by '\n'
stored as textfile;
1.2 加载数据
load data inpath '/duowan_user.txt' into table duowan;
1.3 开始执行
select pass , count(*) as count from duowan group by pass order by count desc limit 10;
1.4 设置 reduce 个数
set mapreduce.job.reduces=2;
最新文章
- ubuntu 14.04 java开发环境搭建 jdk 以及 inteliJ IDEA安装
- UImenuController
- 墨卡托投影C#实现
- JavaScript-计算器
- notification的使用
- maven提示invalid LOC header (bad signature)的解决办法
- Spark延长SparkContext初始化时间
- liveusb-creator
- class_create()
- [补] winpcap编程——EAP协议与EAPSOCKET实现
- Struts2 中的数据传输的几种方式
- 【java提高】---java反射机制
- Mathematica求微分换元
- 前端使用crypto.js进行加密
- [翻译]LVM中逻辑卷的最大大小限制
- shell脚本中冒号
- visual studio 插件
- Jenkins 集成Unity3D Xcode
- js中对象的深度复制
- Oracle11g温习-第一章 2、ORACLE 物理结构