0. 说明

  通过 Hive 对 duowan 数据进行简单处理


1. 操作流程

  1.1 建表

create table duowan(id int, name string, pass string, mail string, nickname string)
row format delimited
fields terminated by '\t'
lines terminated by '\n'
stored as textfile;

  1.2 加载数据

load data inpath '/duowan_user.txt' into table duowan;

  1.3 开始执行

select pass , count(*) as count from duowan group by pass order by count desc limit 10; 

  1.4 设置 reduce 个数

set mapreduce.job.reduces=2;

最新文章

  1. ubuntu 14.04 java开发环境搭建 jdk 以及 inteliJ IDEA安装
  2. UImenuController
  3. 墨卡托投影C#实现
  4. JavaScript-计算器
  5. notification的使用
  6. maven提示invalid LOC header (bad signature)的解决办法
  7. Spark延长SparkContext初始化时间
  8. liveusb-creator
  9. class_create()
  10. [补] winpcap编程——EAP协议与EAPSOCKET实现
  11. Struts2 中的数据传输的几种方式
  12. 【java提高】---java反射机制
  13. Mathematica求微分换元
  14. 前端使用crypto.js进行加密
  15. [翻译]LVM中逻辑卷的最大大小限制
  16. shell脚本中冒号
  17. visual studio 插件
  18. Jenkins 集成Unity3D Xcode
  19. js中对象的深度复制
  20. Oracle11g温习-第一章 2、ORACLE 物理结构

热门文章

  1. LeetCode每天一题之两数之和
  2. Perl:写POD文档
  3. 20.Module 的语法
  4. CNN大战验证码
  5. [转]在nodejs使用Redis缓存和查询数据及Session持久化(Express)
  6. 第一册:lesson sixty seven。
  7. 从零开始学安全(八)●Ubuntu 16 LAMP环境搭建
  8. [日常] HTTP连接管理
  9. 谈下mysql预处理基础
  10. 【Spring】DispatcherServlet的启动和初始化