HBase

1、hbase为查询而生,它通过组织机器的内存,提供一个超大的内存hash表,它需要组织自己的数据结构,表在hbase中是物理表,而不是逻辑表,搜索引擎用它来存储索引,以满足实时查询的需求;

2、hbase 是一个基于列存储的非关系型数据库,查询效率高,主要用于查询和展示结果;
 
3、hbase可以认为是hdfs的一个包装。它的本质是数据存储,是个nosql数据库;hbase部署于hdfs之上,并且克服了hdfs在随机读写方面的缺点。
 

Hive/数据库

1、hive提供了一套查询hadoop海量数据的接口,以sql为基础;

2、hive是分布式的关系型数据库查询接口,它不是一个数据库;用于并行分布式处理大量数据。
 
3、它建立在hadoop之上,所有hive的数据都是存储在hdfs中的。而数据库则可以将数据保存在块设备或者本地文件系统中。
 
4、hive中所有查询除了“select * from table”之外,所有的查询都是需要通过map-reduce实现的,在处理大量数据的时候,hive的优势就能体现出来。
 
5、它可以认为是map-reduce的一个包装,将写好的sql转化为复杂难写的map-reduce程序;
 
6、hive中不支持对数据的改写和添加,只能通过覆盖来实现数据修改;
 
7、hive中没有key的概念,不会建立数据索引,这和mysql不一样;需要访问某些满足条件的特定结果时,都需要暴力扫描整个数据,因此访问延迟高。
 
8、hive 建立在集群上可以利用map-reduce并行计算,因此可以支持很大规模的数据;对应的,数据库可以支持的数据规模较小。
 
 

最新文章

  1. linux Mint18 backspace怎么不能连续删除
  2. ComboSelect 下拉筛选
  3. table表格中的内容溢出布局方式
  4. android 网络请求库的比较
  5. 用DataBaseMail发图片并茂的邮件
  6. DevSecOps 实施篇!系列(二)
  7. 通信基站(dfs回溯,思维)
  8. 基于FPGA的OLED真彩色动态图像显示的实现
  9. CentOS7.x编译安装zabbix4.0
  10. Java多线程之ReentrantLock与Condition
  11. Jmeter读取Excel,BeanShell取样器调用rt.jar和jxl.jar
  12. 关于忘记Jenkins管理员密码的解决办法
  13. Python脱产8期 Day014 2019/4/28
  14. Vue 小组件input keyup.enter绑定
  15. 关于c#中委托与事件的一些理解
  16. Redis学习(3)——认识配置文件redis.conf[转]
  17. 有关Botton的用法(二)
  18. redis的有序集合(Sorted Sets)数据类型
  19. 取Session数据语句在应放在哪里
  20. 【反演复习计划】【bzoj3529】数表

热门文章

  1. Repair 暴力
  2. less css用法思维导图
  3. <Linux系统isosize指令用法>
  4. linux下使用shell脚本批处理命令
  5. Java学习笔记--类和对象
  6. .net笔试题一(简答题)
  7. 利用XML序列化和Asp.Net Web缓存实现站点配置文件
  8. JavaSE之Java基础(3)
  9. vue-elem-stylus 的mixin用法
  10. SHOW SLAVE STATUS 详解