Apache Kudu Overview

建议配合[Apache Kudo]审阅本文(http://kudu.apache.org/overview.html)


数据模式

Kudo是一个列式存储的用于快速分析的NoSQL数据库,提供了类似SQL的查询语句,与RDBMS十分类似,有PRIMARY KEY ,基于主键查询而不是HBase的RowKey


低延迟随机存取

与其他大数据数据库不同,Kudu不仅仅是一个文件格式。行访问达到毫秒级延迟,支持C++ JAVA, API PyThon API 拥有简单好用的API


融会贯通入Hadoop生态系统

你可以使用Java Client实时导入数据,同时也支持Spark(运算) impala(分析工具,比Hive快) MapReduce HDFS HBase 很容易从HDFS中获取数据,占用内存小于1G


Super-fast Columnar Storage

列式存储有利于编码和压缩,数据比使用Parquet压缩还省空间。这样的高压缩,降低了数据的IO,为计算服务。使用如laze data这样的技术,使得超高速成为可能


分布式和容错机制

Kudu通过把tables切分成tablets,每个表都可以配置切分的哈希,分区和组合
Kudu使用了Raft来复制给定的操作,保证了数据同时存储在两个节点上,因此不村子单点故障。


为下一代硬件设计

说的是他们深入了解了下一代处理器架构等等,在IO和资源优化等等方面做了一下改进

最新文章

  1. 微软Nokia 222:可拍照可上网 售价37美元 32GB的microSD卡扩展
  2. HDOJ 1536 S-Nim
  3. 大道至简—SQLite3 使用教学
  4. hadoop2.2编程:从default mapreduce program 来理解mapreduce
  5. 如果在Xcode6中创建空工程, 删除冗余信息
  6. 【转】mybatis 获取自增id
  7. .NET(C#):XML序列化时派生类的处理
  8. 改变TPageControl的活动标签颜色
  9. 计算机网络分层(OSI七层、 TCP/IP四层)
  10. 【Java学习笔记之三十三】详解Java中try,catch,finally的用法及分析
  11. [UE4]引用Grabbable接口
  12. CentOS自带定时任务crontab
  13. MySQL5.6复制技术(1)-原理详解
  14. 检查是否使用PAM认证模块禁止wheel组之外的用户su为root
  15. FFT自看
  16. Redis网络协议
  17. Java 中byte 与 char 的相互转换 Java基础 但是很重要
  18. Spring MVC 学习 之 - 拦截器
  19. Spring源码解析 - ListableBeanFactory
  20. bash shell 关系

热门文章

  1. vue v-on:事件
  2. Android 回调的理解,觉得写得好就转过来。。。收藏一下
  3. 【LOJ6041】「雅礼集训 2017 Day7」事情的相似度(用LCT维护SAM的parent树)
  4. POJ 2528 Mayor's posters 【区间离散化+线段树区间更新&&查询变形】
  5. 使用ToDateTime方法转换日期显示格式
  6. 2018.12.20 Spring环境如何搭建
  7. Cesium.js隐藏logo等信息
  8. 【洛谷P3225】[HNOI2012]矿场搭建
  9. Angularjs 数据双向绑定
  10. iview+axios实现文件取消上传