Hive学习 系列博客
2024-10-22 08:17:09
博客来源,https://blog.csdn.net/youfashion/article/category/6190828,感谢博主。
学习博主的代码风格。
Hive
1)Hive 是建立在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库;
2)一种可以存储、查询和分析存储在Hadoop 中的大规模数据的机制;
3)Hive 定义了简单的类SQL 查询语言,称为HQL,它允许熟悉SQL 的用户查询数据;
4)允许用Java开发自定义的函数UDF来处理内置无法完成的复杂的分析工作;
5)Hive没有专门的数据格式(分隔符等可以自己灵活的设定);
ETL的流程(Extraction-Transformate-Loading):
将关系型数据库的数据抽取到HDFS上,hive作为数据仓库,经过hive的计算分析后,将结果再导入到关系型数据库的过程。
最新文章
- Android Gson的使用总结
- oneuijs/You-Dont-Need-jQuery
- SSH邮箱验证与激活
- ActionScript 3.0 自写类整理笔记(十三)——Random类
- Redis笔记,安装和常用命令
- BOM (Browser Object Model) 浏览器对象模型
- Django--BBS项目
- #Linux学习笔记# Linux文件的所有者、群组和其他人
- COJ 拯救瑞恩
- Castle ActiveRecord学习实践
- poj1009
- 自定义控件(视图)2期笔记08:自定义控件之 9patch图说明
- Xah Lee Web 李杀网
- Simple Automated Backups for MongoDB Replica Sets
- 如何在VBS脚本中显示“选择文件对话框”或“选择目录对话框”
- iOS开发之JSON转PLIST(把存储json格式的文件转换成plist文件)
- IaaS,PaaS和SaaS
- HDU 2459 Maximum repetition substring
- centos6.9设置桥接网络模式方法
- C# 队列(Queue)和 堆栈(Stack)