ETL是什么?

ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。(数据仓库结构)通俗的说法就是从数据源抽取数据出来,进行清洗加工转换,然后加载到定义好的数据仓库模型中去。目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节,其设计的好坏影响生成数据的质量,直接关系到BI项目的成败。

目前比较常用的etl工具有DataPipeline,Kettle,Talend,Informatica

易用性:

DataPipeline: 有非常容易使用的 GUI,具有丰富的可视化监控;

Kettle: GUI+Coding;

Informatica: GUI+Coding,有GUI,但是要专门的训练;

Talend:GUI+Coding,有 GUI 图形界面但是以 Eclipse 的插件方式提供;

技能要求:

DataPipeline:操作简单,无技术要求;

Kettle: ETL设计, SQL, 数据建模 ;

Informatica: ETL设计, SQL, 数据建模;

Talend:需要写Java;

底层架构:

DataPipeline:分布式,可水平扩展;

Kettle:主从结构非高可用;

Informatica:分布式;

Talend:分布式;

数据实时性:

DataPipeline:支持异构数据源的实时同步,速度非常快;

Kettle:不支持实时数据同步;

Informatica:支持实时,效率较低;

Talend:支持实时处理,需要购买高级版本,价格贵;

技术支持:

DataPipeline:本地化原厂技术支持;

Kettle:无;

Informatica:主要在美国;

Talend:主要在美国;

相关链接文档:https://wenku.baidu.com/view/6931cb1659eef8c75fbfb358.html

最新文章

  1. Android将应用调试log信息保存在SD卡
  2. 深入理解CSS线性渐变linear-gradient
  3. Linux搭建smtp服务器+laravel5.2发邮件配置
  4. VS2012中数据库架构的比较
  5. Oracle数据库SQL优化
  6. MySQL 权限?
  7. jquery easyui动态校验,easyui动态验证
  8. JavaScript MVC 框架[转载]
  9. 【译】addEventListener 第二个参数
  10. UVA 1623 Enter The Dragon
  11. 让struts2和servlet共存
  12. 作业2——英语学习APP的案例分析
  13. 字符串解码DecodeString
  14. FusionWidgets Bulb图
  15. 小米8 探索版 屏幕指纹版超简单卡刷开发版获取Root权限的教程
  16. 面向对象_classmethod_staticmethod
  17. unity游戏热更新
  18. OpenCV常用库函数[典]
  19. tomcat配置的环境变量catalina.home和catalina.base 区别
  20. Tortoisegit生成SSH密钥一次性输入密码

热门文章

  1. CSS ,flex: 1的用处
  2. Docker学习笔记(2)--Docker常用命令
  3. djangoform表单使用验证码
  4. 14 Windows编程——SetWindowLong
  5. STM32复位及通过函数判断是何种条件出发的复位
  6. 商汤开源的mmdetection技术报告
  7. 数组中的filter,every,some,find,findIndex
  8. STM32 LoRaWAN探索板B-L072Z-LRWAN1中文用户手册
  9. Pytohn笔记(31)----第三方包
  10. 【转】SENDING KEY VALUE MESSAGES WITH THE KAFKA CONSOLE PRODUCER