• Oozie是什么?

Oozie最初是Yahoo!为Hadoop开发的一个工作流调度器,一个工作流有多个Job组成。它允许用户提交由多个Job组成的工作流配置文件,这些Job既可以顺序执行,也可以并行执行,还可以配置其中的Job定时执行、出错重新执行等。

Oozie提供了Java Client API和Web Service API以及命令行接口,使用简单。

现在是Apache的一个开源项目。

  • 为什么使用Oozie?

主要是为了更方便、自由的使用Hadoop,提交作业。

对一个集群中每天有大量左右需要提交执行的情况来说,使用Oozie管理这些Job很方便。

另外一点就是,如果有Job执行出错,可以配置Oozie重新执行这些Job。

  • 如何使用Oozie?
    1. 首先需要执行的Job的配置写入workflow.xml,配置中需要指明每个Job的输入文件、输出文件、输出Reader、输出Writer、Mapper、Reducer、Job的执行参数
    2. 然后提交这个xml文件
    3. 配置workflow的property (指明Name Node、JobTraker、job执行过程中所使用的jar包的location)

关于oozie的更多信息,请参考:
http://yahoo.github.com/oozie/
http://yahoo.github.com/oozie/releases/3.1.0/
http://incubator.apache.org/oozie

--------------
本文地址:http://nourlcn.ownlinux.net/2011/11/oozie-what-why-and-how.html

https://twitter.com/nourlcn

2011-11-20

最新文章

  1. 再讲IQueryable<T>,揭开表达式树的神秘面纱
  2. 手机设计尺寸 - iPhone界面尺寸
  3. http 状态码含义
  4. 2.4G/5G频段WLAN各国使用信道表
  5. CGRectInset & CGRectOffset
  6. java编译正常javac出错不是内部或外部命令
  7. CoreAnimation--CALayer的动画
  8. 使用C#访问SQLLite
  9. 啊哈C!思考快你一步——用编程轻松提升逻辑力
  10. 把notepad++设置为系统全局文本默认打开应用
  11. GS初始化
  12. Android-AnimationDrawable(三)运行的几种方式
  13. 洛谷 P1005 矩阵取数游戏
  14. 汉诺塔 Hanoi Tower
  15. mac 常用的开发工具
  16. k8s 如何 Failover?- 每天5分钟玩转 Docker 容器技术(127)
  17. ACM算法竞赛:抄课文
  18. 基于Metronic的Bootstrap开发框架--工作流模块功能介绍(2)
  19. Windows批处理命令用法
  20. JavaScript获取键盘事件

热门文章

  1. iBatis2之SqlMap配置总结(18条)
  2. (转)eclipse 代码自动补全
  3. java版-JQuery上传插件Uploadify使用实例
  4. zepto.1.1.6.js源码中的each方法学习笔记
  5. PHP内置函数getimagesize()的漏洞
  6. Python for else 循环控制
  7. Stall Reservations(POJ 3190 贪心+优先队列)
  8. linux下JDK,tomcat的安装与环境变量配置
  9. EXW_FOB_CIF_CFR 外贸报价方式&条款之间的区别与联系
  10. USB Mass Storage学习笔记-STM32+FLASH实现U盘