1. kafka整体结构图

Kafka名词解释和工作方式

  • Producer :消息生产者,就是向kafka broker发消息的客户端。
  • Consumer :消息消费者,向kafka broker取消息的客户端
  • Topic :咋们可以理解为一个队列。
  • Consumer Group (CG):这是kafka用来实现一个topic消息的广播(发给所有的consumer)和单播(发给任意一个consumer)的手段。一个topic可以有多个CG。topic的消息会复制(不是真的复制,是概念上的)到所有的CG,但每个partion只会把消息发给该CG中的一个consumer。如果需要实现广播,只要每个consumer有一个独立的CG就可以了。要实现单播只要所有的consumer在同一个CG。用CG还可以将consumer进行自由的分组而不需要多次发送消息到不同的topic。
  • Broker :一台kafka服务器就是一个broker。一个集群由多个broker组成。一个broker可以容纳多个topic。
  • Partition:为了实现扩展性,一个非常大的topic可以分布到多个broker(即服务器)上,一个topic可以分为多个partition,每个partition是一个有序的队列。partition中的每条消息都会被分配一个有序的id(offset)。kafka只保证按一个partition中的顺序将消息发给consumer,不保证一个topic的整体(多个partition间)的顺序。
  • Offset:kafka的存储文件都是按照offset.kafka来命名,用offset做名字的好处是方便查找。例如你想找位于2049的位置,只要找到2048.kafka的文件即可。当然the first offset就是00000000000.kafka

2. topic和Consumer的关系

本质上kafka只支持Topic

  • 每个group中可以有多个consumer,每个consumer属于一个consumer group;
  • 通常情况下,一个group中会包含多个consumer,这样不仅可以提高topic中消息的并发消费能力,而且还能提高"故障容错"性,如果group中的某个consumer失效那么其消费的partitions将会有其他consumer自动接管
  • 对于Topic中的一条特定的消息,只会被订阅此Topic的每个group中的其中一个consumer消费,此消息不会发送给一个group的多个consumer;
  • 那么一个group中所有的consumer将会交错的消费整个Topic,每个group中consumer消息消费互相独立,我们可以认为一个group是一个"订阅"者。
  • 在kafka中,一个partition中的消息只会被group中的一个consumer消费(同一时刻)
  • 一个Topic中的每个partions,只会被一个"订阅者"中的一个consumer消费,不过一个consumer可以同时消费多个partitions中的消息。
  • kafka的设计原理决定,对于一个topic,同一个group中不能有多于partitions个数的consumer同时消费,否则将意味着某些consumer将无法得到消息。
  • kafka只能保证一个partition中的消息被某个consumer消费时是顺序的;事实上,从Topic角度来说,当有多个partitions时,消息仍不是全局有序的。

3. Kafka消息的分发

Producer客户端负责消息的分发

  • kafka集群中的任何一个broker都可以向producer提供metadata信息,这些metadata中包含"集群中存活的servers列表","partitions leader列表"等信息;
  • 当producer获取到metadata信息之后, producer将会和Topic下所有partition leader保持socket连接;
  • 消息由producer直接通过socket发送到broker,中间不会经过任何"路由层",事实上,消息被路由到哪个partition上由producer客户端决定;
  • 比如可以采用"random""key-hash""轮询"等,如果一个topic中有多个partitions,那么在producer端实现"消息均衡分发"是必要的。
  • 在producer端的配置文件中,开发者可以指定partition路由的方式

Producer消息发送的应答机制

  设置发送数据是否需要服务端的反馈,有三个值0,1,-1

     0: producer不会等待broker发送ack

     1: 当leader接收到消息之后发送ack

    -1: 当所有的follower都同步消息成功后发送ack

    request.required.acks=0

4. Consumer的负载均衡

当一个group中,有consumer加入或者离开时,会触发partitions均衡,均衡的最终目的,是提升topic的并发消费能力,步骤如下:

  (1) 假如topic1,具有如下partitions: P0,P1,P2,P3

  (2) 假如group中,有如下consumer: C1,C2

  (3) 首先根据partition索引号对partitions排序: P0,P1,P2,P3

(4) 根据consumer.id排序: C0,C1

  (5) 计算倍数: M = [P0,P1,P2,P3].size / [C0,C1].size,本例值M=2(向上取整)

  (6) 然后依次分配partitions: C0 = [P0,P1],C1=[P2,P3],即 Ci = [P(i * M),P((i + 1) * M -1)]

5. kafka文件存储机制

5.1 Kafka文件存储基本结构

  (1)在Kafka文件存储中,同一个topic下有多个不同partition,每个partition为一个目录,partiton命名规则为topic名称+有序序号,第一个partiton序号从0开始,序号最大值为partitions数量减1。

  (2)每个partion(目录)相当于一个巨型文件被平均分配到多个大小相等segment(段)数据文件中。但每个段segment file消息数量不一定相等,这种特性方便old segment file快速被删除。默认保留7天的数据。

  (3)每个partiton只需要支持顺序读写就行了,segment文件生命周期由服务端配置参数决定。(什么时候创建,什么时候删除)

数据是否有序?

一个partition的数据间隔性有序,不连续;针对一个topic里面的数据,只能做到partition内部有序,不能做到全局有序。只有一种情况下才能保证全局有序,就是只有一个partition

5.2 Kafka Partition Segment

  • Segment file组成:由2大部分组成,分别为index file和data file,此2个文件一一对应,成对出现,后缀".index"和“.log”分别表示为segment索引文件、数据文件。

  • Segment文件命名规则:partion全局的第一个segment从0开始,后续每个segment文件名为上一个segment文件最后一条消息的offset值。数值最大为64位long大小,19位数字字符长度,没有数字用0填充。
  • 索引文件存储大量元数据,数据文件存储大量消息,索引文件中元数据指向对应数据文件中message的物理偏移地址。

  上述图中索引文件存储大量元数据,数据文件存储大量消息,索引文件中元数据指向对应数据文件中message的物理偏移地址,其中以索引文件中元数据3,497为例,依次在该数据文件中表示第3个message(在全局partiton表示第368772个message)、以及该消息的物理偏移地址为497

5.3 Kafka 查找message

读取offset=368776的message,需要通过下面2个步骤查找。

  (1) 查找segment file 

    00000000000000000000.index表示最开始的文件,起始偏移量(offset)为0

    00000000000000368769.index的消息量起始偏移量为368770 = 368769 + 1

    00000000000000737337.index的起始偏移量为737338=737337 + 1

    其他后续文件依次类推。

    以起始偏移量命名并排序这些文件,只要根据offset **二分查找**文件列表,就可以快速定位到具体文件。当offset=368776时定位到          00000000000000368769.index和对应log文件。

  (2)通过segment file查找message

    当offset=368776时,依次定位到00000000000000368769.index的元数据物理位置和00000000000000368769.log的物理偏移地址,然后再通过       00000000000000368769.log顺序查找直到offset=368776为止。

最新文章

  1. Python3.5在Windows 7下连接ORACLE数据库
  2. IOC装配Bean(注解方式)
  3. LSOF 安装与使用
  4. Get open Popups
  5. Android BlueDroid(一):BlueDroid概述 【转】
  6. CSS小结
  7. s3c6410 开发板Linux系统支持 K9GAG08U0E的方法
  8. 九度OJ 1387 斐波那契数列
  9. param
  10. sql点滴41—mysql常见sql语法
  11. day1-Python入门
  12. Go笔记-方法
  13. Flume报 Space for commit to queue couldn't be acquired. Sinks are likely not keeping up with sources, or the buffer size is too tight
  14. ROS机器人程序设计(原书第2版)补充资料 (壹) 第一章 ROS系统入门
  15. 关于Hibernate级联更新插入信息时提示主键不为空的问题“org.hibernate.StaleStateException: Batch update returned unexpected row count from update: 0 actual row count: 0 expected: 1 ”
  16. geoserver 安装部署发布
  17. python入门——热量转换 I
  18. EasyPR源码剖析(6):车牌判断之LBP特征
  19. python 正则表达式中反斜杠(\)的麻烦和陷阱
  20. 详解promise、async和await的执行顺序

热门文章

  1. FusionCancer-人类癌症相关的融合基因的数据库
  2. C# 一个多层循环中,break一次能跳出几个循环?
  3. ASP.NET程序也能像WinForm程序一样运行[转载]
  4. 【玩转Golang】 自定义json序列化对象时,非法字符错误原因
  5. bootstrapValidator 表单验证
  6. 一键切换hosts文件
  7. qt creator如何实现转到槽功能
  8. 织梦Dedecms系统可疑文件include/filter.inc.php扫描出漏洞,该如何解决?
  9. 配置nginx.config 报错:connect() failed (111: Connection refused) while connecting to upstream解决
  10. mysql中参数low_case_table_name的使用?不同参数值的设置有什么影响?