博客来源,https://blog.csdn.net/youfashion/article/category/6190828,感谢博主。

学习博主的代码风格。

Hive

1)Hive 是建立在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库
2)一种可以存储、查询和分析存储在Hadoop 中的大规模数据的机制;
3)Hive 定义了简单的类SQL 查询语言,称为HQL,它允许熟悉SQL 的用户查询数据;
4)允许用Java开发自定义的函数UDF来处理内置无法完成的复杂的分析工作;
5)Hive没有专门的数据格式(分隔符等可以自己灵活的设定);

ETL的流程(Extraction-Transformate-Loading):

将关系型数据库的数据抽取到HDFS上,hive作为数据仓库,经过hive的计算分析后,将结果再导入到关系型数据库的过程。

最新文章

  1. Android Gson的使用总结
  2. oneuijs/You-Dont-Need-jQuery
  3. SSH邮箱验证与激活
  4. ActionScript 3.0 自写类整理笔记(十三)——Random类
  5. Redis笔记,安装和常用命令
  6. BOM (Browser Object Model) 浏览器对象模型
  7. Django--BBS项目
  8. #Linux学习笔记# Linux文件的所有者、群组和其他人
  9. COJ 拯救瑞恩
  10. Castle ActiveRecord学习实践
  11. poj1009
  12. 自定义控件(视图)2期笔记08:自定义控件之 9patch图说明
  13. Xah Lee Web 李杀网
  14. Simple Automated Backups for MongoDB Replica Sets
  15. 如何在VBS脚本中显示“选择文件对话框”或“选择目录对话框”
  16. iOS开发之JSON转PLIST(把存储json格式的文件转换成plist文件)
  17. IaaS,PaaS和SaaS
  18. HDU 2459 Maximum repetition substring
  19. centos6.9设置桥接网络模式方法
  20. C# 队列(Queue)和 堆栈(Stack)

热门文章

  1. Socket学习总结系列(一) -- IM & Socket
  2. lca最短公共祖先模板(hdu2586)
  3. 简单DP【p1934】封印
  4. Problem T: 零起点学算法15——交换变量
  5. Java堆内存不足
  6. C++类的复习
  7. CSS3:box-sizing 怪异盒模型
  8. linux基础-第二十单元_计划任务crond服务
  9. 伟大的UHD编解码器的辩论:谷歌VP9与HEVC / H.265
  10. 用C++实现文件压缩(1.5)