常用的etl工具比较
ETL是什么?
ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。(数据仓库结构)通俗的说法就是从数据源抽取数据出来,进行清洗加工转换,然后加载到定义好的数据仓库模型中去。目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节,其设计的好坏影响生成数据的质量,直接关系到BI项目的成败。
目前比较常用的etl工具有DataPipeline,Kettle,Talend,Informatica
易用性:
DataPipeline: 有非常容易使用的 GUI,具有丰富的可视化监控;
Kettle: GUI+Coding;
Informatica: GUI+Coding,有GUI,但是要专门的训练;
Talend:GUI+Coding,有 GUI 图形界面但是以 Eclipse 的插件方式提供;
技能要求:
DataPipeline:操作简单,无技术要求;
Kettle: ETL设计, SQL, 数据建模 ;
Informatica: ETL设计, SQL, 数据建模;
Talend:需要写Java;
底层架构:
DataPipeline:分布式,可水平扩展;
Kettle:主从结构非高可用;
Informatica:分布式;
Talend:分布式;
数据实时性:
DataPipeline:支持异构数据源的实时同步,速度非常快;
Kettle:不支持实时数据同步;
Informatica:支持实时,效率较低;
Talend:支持实时处理,需要购买高级版本,价格贵;
技术支持:
DataPipeline:本地化原厂技术支持;
Kettle:无;
Informatica:主要在美国;
Talend:主要在美国;
相关链接文档:https://wenku.baidu.com/view/6931cb1659eef8c75fbfb358.html
最新文章
- Android将应用调试log信息保存在SD卡
- 深入理解CSS线性渐变linear-gradient
- Linux搭建smtp服务器+laravel5.2发邮件配置
- VS2012中数据库架构的比较
- Oracle数据库SQL优化
- MySQL 权限?
- jquery easyui动态校验,easyui动态验证
- JavaScript MVC 框架[转载]
- 【译】addEventListener 第二个参数
- UVA 1623 Enter The Dragon
- 让struts2和servlet共存
- 作业2——英语学习APP的案例分析
- 字符串解码DecodeString
- FusionWidgets Bulb图
- 小米8 探索版 屏幕指纹版超简单卡刷开发版获取Root权限的教程
- 面向对象_classmethod_staticmethod
- unity游戏热更新
- OpenCV常用库函数[典]
- tomcat配置的环境变量catalina.home和catalina.base 区别
- Tortoisegit生成SSH密钥一次性输入密码
热门文章
- CSS ,flex: 1的用处
- Docker学习笔记(2)--Docker常用命令
- djangoform表单使用验证码
- 14 Windows编程——SetWindowLong
- STM32复位及通过函数判断是何种条件出发的复位
- 商汤开源的mmdetection技术报告
- 数组中的filter,every,some,find,findIndex
- STM32 LoRaWAN探索板B-L072Z-LRWAN1中文用户手册
- Pytohn笔记(31)----第三方包
- 【转】SENDING KEY VALUE MESSAGES WITH THE KAFKA CONSOLE PRODUCER