要做数据分析,领导让研究一下kettle。

先占个坑。

这里有个3.0的文档:

http://wenku.baidu.com/link?url=hvw_cOBIXLXSGvftkGhXQic3CLC75-0IILGrtB-AyuxIgaDarhmZjfBLhMRcn9gIUEQPJ1OtxTT9joLgVXyFJxFougqR4ZnTQTCZ8vlIcMW

今天开始搞了一下,下载之后运行了一个sample。

下载安装很简单,到官网,直接download下了一个压缩吧, 解压之后就可以运行了。点spoon.sh, windows对应的时spoon.bat

前提是你要有java运行环境哦。

open目录的几个sample,先了解一些基本概念:

这个玩意儿到底是怎么运作的。

说白了,跟spark区别,不用自己写代码了,数据源可以从各种类型(cvs,txt,hadoop,mysql甚至excel中)导入。

然后,你就按照平台中已有的东东,拖拽一下,形成一个数据分析的逻辑,最终呢,还能生成图表(怎么生成,后面再研究)

上面的例子,Add Checksum, 为每条数据生成一个checksum数据(CRC32),然后Add sequence ,新增一个SequenceField字段,自增加,每次+1.

最新文章

  1. 「理解HTTP」之常见的状态码segmentfault
  2. php----显示中文乱码的问题
  3. IntelliJ下使用Code/Live Template加快编码速度:程序员的工作不是写程序,而是写程序解决问题
  4. C++——string类和标准模板库
  5. Android加载网络图片的工具类
  6. 请问view controller scene,该如何删除
  7. linux乱码问题
  8. Constructing Roads(SPFA+邻接表)
  9. html基本基础
  10. 字典(Tire树)
  11. Python Socket 简单聊天室1
  12. Android编译系统中的Kconfig,Makefile,.config编译系统浅析
  13. C# 获取当前年份的周期,周期所在日期范围
  14. mysql怎样配置ODBC数据源
  15. STSdb数据库的实现使用类
  16. 基于Jmeter和Testlink的自动化测试框架研究与实施
  17. 闪存卡被创建pv报错
  18. VSFTP服务配置
  19. iOS之UITextField限制字数
  20. iis支持asp.net4.0的注册命令使用方法

热门文章

  1. 自己构造用于异步请求的JSON数据
  2. la4730(并查集+树状数组)
  3. [misc]如何在嵌入式平台使用printf功能
  4. H2 Database 支持数据类型
  5. asp.net防止刷新时重复提交
  6. elasticsearch安装与使用(1)-- centos7 elasticsearch的两种简单安装方法
  7. 2015 Multi-University Training Contest 3 1001 Magician
  8. 回文自动机 + DFS --- The 2014 ACM-ICPC Asia Xi’an Regional Contest Problem G.The Problem to Slow Down You
  9. C++ 类的构造函数使用规则
  10. MyBatis-Spring-Boot 使用总结