概念

Workers (JVMs): 在一个物理节点上可以运行一个或多个独立的JVM 进程。一个Topology可以包含一个或多个worker(并行的跑在不同的物理机上), 所以worker process就是执行一个topology的子集, 并且worker只能对应于一个topology 

Executors (threads): 在一个worker JVM进程中运行着多个Java线程。一个executor线程可以执行一个或多个tasks。但一般默认每个executor只执行一个task。一个worker可以包含一个或多个executor, 每个component (spout或bolt)至少对应于一个executor, 所以可以说executor执行一个compenent的子集, 同时一个executor只能对应于一个component。

Tasks(bolt/spout instances):Task就是具体的处理逻辑对象,每一个Spout和Bolt会被当作很多task在整个集群里面执行。每一个task对应到一个线程,而stream grouping则是定义怎么从一堆task发射tuple到另外一堆task。你可以调用TopologyBuilder.setSpout和TopologyBuilder.setBolt来设置并行度 — 也就是有多少个task。

配置并发度

对于并发度的配置, 在storm里面可以在多个地方进行配置, 优先级为:

defaults.yaml < storm.yaml < topology-specific configuration< internal component-specific configuration < external component-specific configuration

worker processes的数目, 可以通过配置文件和代码中配置, worker就是执行进程, 所以考虑并发的效果, 数目至少应该大于machines的数目

executor的数目, component的并发线程数,只能在代码中配置(通过setBolt和setSpout的参数), 例如, setBolt("green-bolt", new GreenBolt(), 2)

tasks的数目, 可以不配置, 默认和executor1:1, 也可以通过setNumTasks()配置

Topology的worker数通过config设置,即执行该topology的worker(java)进程数。它可以通过 storm rebalance 命令任意调整。

3个组件的并发度加起来是10,就是说拓扑一共有10个executor,一共有2个worker,每个worker产生10 / 2 = 5条线程。

绿色的bolt配置成2个executor和4个task。为此每个executor为这个bolt运行2个task。

动态的改变并行度

Storm支持在不 restart topology 的情况下, 动态的改变(增减) worker processes 的数目和 executors 的数目, 称为rebalancing. 通过Storm web UI,或者通过storm rebalance命令实现:

storm rebalance mytopology -n 5 -e blue-spout=3 -e yellow-bolt=10

最新文章

  1. JavaScript中的this陷阱的最全收集
  2. Target-Action回调模式
  3. ios build时,Undefined symbols for architecture xxx问题的总结
  4. 打造H5里的“3D全景漫游”秘籍
  5. Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat)
  6. Tomcat下使用war包发布项目
  7. java 8-6 抽象的练习
  8. C语言:typedef 跟 define 的区别
  9. Stm32_调试出现 Error:Flash Download Failed-&quot;Cortex-M3&quot;
  10. MS dos版本
  11. linux(vi)多行注释和取消注释.
  12. FTP连接虚拟主机响应220 Welcome to www.net.cn FTP service. (解决的一个问题)
  13. Tapestry3.0开发概论
  14. 洗礼灵魂,修炼python(89)-- 知识拾遗篇 —— 进程
  15. FastJson一些常见方法(API):处理JSON变得好简单
  16. spring(一、原理、IOC、AOP、依赖注入)
  17. String str.trim()
  18. Android开发 - 更&quot;聪明&quot;的申请权限方式
  19. Docker 修改存储路径
  20. mysql执行流程

热门文章

  1. C++ pbds 库平衡树(tree)
  2. POJ 3159 Candies (图论,差分约束系统,最短路)
  3. java 7 升级后,控制面板里找不到java图标了
  4. SQL Server 查询性能优化——覆盖索引
  5. C#基础概念
  6. 35个java代码性能优化总结
  7. Bugfree——CentOS6.8搭建测试环境
  8. CF876 D 树状数组
  9. Java SpringMVC框架学习(三)springMVC的执行流程
  10. 小记 HTML5 file对象