【pentaho】【kettle】【Data Integration】试用
2024-08-28 09:06:16
要做数据分析,领导让研究一下kettle。
先占个坑。
这里有个3.0的文档:
http://wenku.baidu.com/link?url=hvw_cOBIXLXSGvftkGhXQic3CLC75-0IILGrtB-AyuxIgaDarhmZjfBLhMRcn9gIUEQPJ1OtxTT9joLgVXyFJxFougqR4ZnTQTCZ8vlIcMW
今天开始搞了一下,下载之后运行了一个sample。
下载安装很简单,到官网,直接download下了一个压缩吧, 解压之后就可以运行了。点spoon.sh, windows对应的时spoon.bat
前提是你要有java运行环境哦。
open目录的几个sample,先了解一些基本概念:
这个玩意儿到底是怎么运作的。
说白了,跟spark区别,不用自己写代码了,数据源可以从各种类型(cvs,txt,hadoop,mysql甚至excel中)导入。
然后,你就按照平台中已有的东东,拖拽一下,形成一个数据分析的逻辑,最终呢,还能生成图表(怎么生成,后面再研究)
上面的例子,Add Checksum, 为每条数据生成一个checksum数据(CRC32),然后Add sequence ,新增一个SequenceField字段,自增加,每次+1.
最新文章
- 「理解HTTP」之常见的状态码segmentfault
- php----显示中文乱码的问题
- IntelliJ下使用Code/Live Template加快编码速度:程序员的工作不是写程序,而是写程序解决问题
- C++——string类和标准模板库
- Android加载网络图片的工具类
- 请问view controller scene,该如何删除
- linux乱码问题
- Constructing Roads(SPFA+邻接表)
- html基本基础
- 字典(Tire树)
- Python Socket 简单聊天室1
- Android编译系统中的Kconfig,Makefile,.config编译系统浅析
- C# 获取当前年份的周期,周期所在日期范围
- mysql怎样配置ODBC数据源
- STSdb数据库的实现使用类
- 基于Jmeter和Testlink的自动化测试框架研究与实施
- 闪存卡被创建pv报错
- VSFTP服务配置
- iOS之UITextField限制字数
- iis支持asp.net4.0的注册命令使用方法
热门文章
- 自己构造用于异步请求的JSON数据
- la4730(并查集+树状数组)
- [misc]如何在嵌入式平台使用printf功能
- H2 Database 支持数据类型
- asp.net防止刷新时重复提交
- elasticsearch安装与使用(1)-- centos7 elasticsearch的两种简单安装方法
- 2015 Multi-University Training Contest 3 1001 Magician
- 回文自动机 + DFS --- The 2014 ACM-ICPC Asia Xi’an Regional Contest Problem G.The Problem to Slow Down You
- C++ 类的构造函数使用规则
- MyBatis-Spring-Boot 使用总结