抽取(Extract):

一般抽取过程需要连接到不同的数据源,以便为随后的步骤提供数据。这一部分看上去简单而琐碎,实际上它是 ETL 解决方案的成功实施的一个主要障碍。

转换(Transform):

任何对数据的处理过程都是转换。这些处理过程通常包括(但不限于)下面一些操作:
移动数据
根据规则验证数据
数据内容和数据结构的修改
将多个数据源的数据集成
根据处理后的数据计算派生值和聚集值

加载(Load):

将数据加载到目标系统的所有操作。
概念扩展:ELT,EII(Enterprise information integration)/Data federation

架构图:

商业ETL

 Informatica
IBM DataStage
Microsoft SSIS
Oracle ODI

开源ETL

 Kettle
Talend
CloverETL
Ketl,Octopus …

最新文章

  1. C#入门基础二
  2. linux split (分割文件)命令
  3. Debian修改ssh端口和禁止root远程登陆设置
  4. SqlDevlepor注册表监听器设置
  5. (转)Asp.Net MVC中身份认证和授权
  6. angular 项目回顾
  7. 你好,C++(14)如何描述“一个名叫陈良乔,年龄33岁,身高173厘米,体重61.5千克的男人”——3.8 用结构体类型描述复杂的事物
  8. slave 成为master 时候执行的操作notify_master /etc/keepalived/send_master.sh
  9. sublime_text 破解
  10. Fedora24 升级到25
  11. TEXT宏
  12. 2018OKR年中回顾
  13. Chapter 4 Invitations——22
  14. python之三级目录
  15. eclipse打开package explorer视图
  16. Spring Cloud(Dalston.SR5)--Config 集群配置中心
  17. [PLC]ST语言四:INV_MEP_MEF_PLS_PLF_MC_MCR
  18. numpy 中的axis轴问题
  19. opencv——Rect和RotatedRect类详解
  20. html , body , margin , overflow 之大乱战

热门文章

  1. iOS面试题总结(一)
  2. Android 监听ScrollView的滑动
  3. 在xib中用KVC修改控件属性
  4. iOS开发之功能模块--用runtime给UIView类别拓展PressMenu工具
  5. ORA-12520: TNS:listener could not find available handler for requested type of server
  6. Linux 客户端访问 NFS报Permission Denied错误
  7. .NET重构(类型码的设计、重构方法)
  8. 【转】Java并发编程:深入剖析ThreadLocal
  9. Linux From Scratch(从零开始构建Linux系统,简称LFS)- Version 7.7(三)
  10. shell实现ping命令查看哪些主机在线