一、hive用本地文件进行词频统计

1.准备本地txt文件

2.启动hadoop,启动hive

3.创建数据库,创建文本表

4.映射本地文件的数据到文本表中

5.hql语句进行词频统计交将结果保存到结果表中。

6.查看统计结果

二、hive用HDFS上的文件进行词频统计

1.准备电子书或其它大的文本文件

2.将文本文件上传到HDFS上

3.创建文本表

4.映射HDFS中的文件数据到文本表中

5.hql语句进行词频统计交将结果保存到结果表中

6.查看统计结果

最新文章

  1. ASP.NET MVC的客户端验证:jQuery的验证
  2. math方法
  3. 初识python中的类与对象
  4. [Python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒
  5. jQuery Callback 函数
  6. [原创]个人工具 - YE快速复制助手(YeFastcopyHelper)
  7. Linux下搭建BT服务器
  8. C# 根据Word模版生成Word文件
  9. Fireworks Extension —— 开发篇(Dom模型)
  10. 关于MySQL性能的比较
  11. Unix/Linux环境C编程入门教程(15) BT5开发环境搭建
  12. Android程序报错 Connection refused 处理
  13. 转: js中的getYear()函数的问题(推荐用 getFullYear())
  14. lazy ideas in programming
  15. shiro(三),使用第三方jdbcRealm连接数据库操作
  16. css对齐方案总结
  17. [Android] Android 手机下 仿 今日头条 新闻客户端
  18. java串口通信丢包
  19. Linux命令:popd
  20. Integer的NPE问题

热门文章

  1. Android NDK build vsomeip3
  2. PowerShell学习笔记二_变量、Select、Foreach、where、自动变量
  3. asp.net core 解决用户上传文件提示 System.UnauthorizedAccessException: Access to the path 'C:\Windows\TEMP\ASPNETCORE_e65c14f7-e337-493c-90ac-d49a48db7187.tmp' is denied.
  4. vue组件传值 | 子父组件
  5. 权昌TSC条码打印机终极使用教程与开发版本代码大全
  6. maven 引入了jar包,但却不能使用jar包里类
  7. (四)kafka基础术语
  8. HDLbits——Exams/2014 q4b
  9. Greg and Array CodeForces - 296C - 差分
  10. ABAP 物料主数据 屏幕增强按钮