ETL基础1(概念)
2024-10-18 13:22:11
抽取(Extract):
一般抽取过程需要连接到不同的数据源,以便为随后的步骤提供数据。这一部分看上去简单而琐碎,实际上它是 ETL 解决方案的成功实施的一个主要障碍。
转换(Transform):
任何对数据的处理过程都是转换。这些处理过程通常包括(但不限于)下面一些操作:
移动数据
根据规则验证数据
数据内容和数据结构的修改
将多个数据源的数据集成
根据处理后的数据计算派生值和聚集值
加载(Load):
将数据加载到目标系统的所有操作。
概念扩展:ELT,EII(Enterprise information integration)/Data federation
架构图:
商业ETL
Informatica
IBM DataStage
Microsoft SSIS
Oracle ODI
开源ETL
Kettle
Talend
CloverETL
Ketl,Octopus …
最新文章
- C#入门基础二
- linux split (分割文件)命令
- Debian修改ssh端口和禁止root远程登陆设置
- SqlDevlepor注册表监听器设置
- (转)Asp.Net MVC中身份认证和授权
- angular 项目回顾
- 你好,C++(14)如何描述“一个名叫陈良乔,年龄33岁,身高173厘米,体重61.5千克的男人”——3.8 用结构体类型描述复杂的事物
- slave 成为master 时候执行的操作notify_master /etc/keepalived/send_master.sh
- sublime_text 破解
- Fedora24 升级到25
- TEXT宏
- 2018OKR年中回顾
- Chapter 4 Invitations——22
- python之三级目录
- eclipse打开package explorer视图
- Spring Cloud(Dalston.SR5)--Config 集群配置中心
- [PLC]ST语言四:INV_MEP_MEF_PLS_PLF_MC_MCR
- numpy 中的axis轴问题
- opencv——Rect和RotatedRect类详解
- html , body , margin , overflow 之大乱战
热门文章
- iOS面试题总结(一)
- Android 监听ScrollView的滑动
- 在xib中用KVC修改控件属性
- iOS开发之功能模块--用runtime给UIView类别拓展PressMenu工具
- ORA-12520: TNS:listener could not find available handler for requested type of server
- Linux 客户端访问 NFS报Permission Denied错误
- .NET重构(类型码的设计、重构方法)
- 【转】Java并发编程:深入剖析ThreadLocal
- Linux From Scratch(从零开始构建Linux系统,简称LFS)- Version 7.7(三)
- shell实现ping命令查看哪些主机在线