Redshift是Amazon一个商业产品上的进化

但并不是技术的进化,他使用的无非都是传统数仓领域的技术

如果说创新,就是大量使用Amazon本身的云服务的云原生架构,大大提升的产品的迭代速度,可维护性,管控能力,当然前提是Amazon有那么好的基础设施可以用

架构

DataPlane

典型的Share Nothing的架构,没啥好说的

LeaderNode,会负责接收流量,生成执行计划分发到计算节点,然后聚合结果返回

数据可以scaleout的分布在计算节点上,同时每个计算节点分成slices,便于资源分配,类似slot

每个slice的数据是以列存形式

Slice由data blocks组成,datablock是数据和磁盘读写和交换的单元,

block会同步写入主备,两副本;同时block会被异步写入S3

Control Plane

对于管控,Redshift基本就是用云原生的方式搭建,大大降低了产品的开发成本

本论文在技术上,没有太多可说的,在产品的设计上倒是很有参考和借鉴的意义

最新文章

  1. Error configuring application listener of class。。。NoClassDefFoundError。。某Listener 之启动tomcat报错
  2. HOLOLENS的DEVICE POTAL连接和安装
  3. js(引用类型和setTimeout scope)
  4. notepad++ erlang开发环境设置
  5. javascript什么是函数
  6. 不合法语句 self.contentView.frame.origin.x = x;
  7. ural1028 Stars
  8. FTP文件上传 支持断点续传 并 打印下载进度(二) —— 单线程实现
  9. Spring高级装配bean
  10. LDAP & Implentation
  11. git仓库迁移
  12. MongoDB存储引擎选择
  13. C++ 实现分数的四则运算
  14. Docker入门03——Container
  15. vscode常用快捷键和插件(持续更新),以及一些常用设置的坑和技巧
  16. JavaScript和HTML DOM的区别与联系
  17. CentOS上传下载查看命令
  18. OLAP引擎——Kylin介绍(很有用)
  19. Python——付费/版权歌曲下载
  20. Shell——Linux/Mac 终端复制文件内容到剪切板

热门文章

  1. 什么是NameNode和DataNode?他们是如何协同工作的?
  2. 1-N(1的总数)找规律
  3. Linux就该这么学——新手必须掌握的命令之打包压缩与搜索命令组
  4. OnVScroll的通常处理
  5. C#将字符串格式化为Json
  6. ES6入门一:块级作用域(let&const)、spread展开、rest收集
  7. vue-cli 3.0不能用module.exports为undefined,导致第三方js都没有办法引用
  8. 【Java】 BIO与NIO以及AIO分析
  9. Fescar锁和隔离级别的理解
  10. 基于MQTT的串口数据转发器