Eureka 系列(02)Eureka 一致性协议

Eureka 是由 Netflix 基于 AP 模型的服务发现中间件,包括服务发现服务器和客户端的。相关文档推荐:一是 Spring Cloud Eureka 官网,二是 Eureka源码解析

本系列源码分析基于 spring-cloud-starter-netflix-eureka-2.1.1.RELEASE 和 Eureka-1.9.8。

0. Spring Cloud 系列目录 - Eureka 篇

1. 服务发现方案对比

1.1 技术选型

表1:Spring Cloud 服务发现方案对比

技术选型 CAP模型 适用规模(建议) 控制台管理 社区活跃度
Eureka AP <30k 支持
Zookeeper CP <20k 不支持
Consul AP <5k 支持
Nacos AP/CP 100k+ 支持 靠大家啦☺

注: 以上数据来源于 小马哥技术周报

1.2 数据模型

表2:Spring Cloud 服务发现数据模型

框架 集群(框架) 服务应用 服务集群 服务实例 租约管理
Spring-Cloud -- (serviceId) -- ServiceInstance --
Nacos Server Service Cluster Instance --
Eureka (serviceUrl) Application(appName) -- InstanceInfo(id) Lease

不同的框架对应的数据结构不太一致,在此做一些约定:

  1. 服务器集群 Server:指的是 Eureka Server 本身的集群。用 Server 代替,也可能是 ServerList 之类,总之与 Server 或 Peer 或 Node 相关的都代表框架自身的集群。
  2. 服务 Service:代表一个应用,可能包含多个服务实例。 Service(服务)serviceIdApplication(应用)appName
  3. 集群 Cluster:一个 Service 可能包含多个 Cluster,Cluster 包含多个具体的实例。这是 Nacos 中的概念。
  4. 服务实例 ServiceInstance:代表注册的一个具体实例。ServiceInstance(服务实例)InstanceInfo(实例id)Instance(实例)

2. Eureka 一致性协议

Eureka 和 Zookeeper 的最大区别: Eureka 是 AP 模型,Zookeeper 是 CP 模型。在出现脑裂等场景时,Eureka 可用性是每一位,也就是说出现脑裂时,每个分区仍可以独立提供服务,是去中心化的。更多 Eureka与ZooKeeper 的比较

那 Eureka 是如何实现最终一致性的呢?

2.1 消息广播

  1. Eureka Server 管理了全部的服务器列表(PeerEurekaNodes)

  2. 当 Eureka Server 收到客户端的注册、下线、心跳请求时,通过 PeerEurekaNode 向其余的服务器进行消息广播,如果广播失败则重试,直到任务过期后取消任务,此时这两台服务器之间数据会出现短暂的不一致。

    注意: 虽然消息广播失败,但只要收到客户端的心跳,仍会向所有的服务器(包括失联的服务器)广播心跳任务。

  3. 如果网络恢复正常,收到了其它服务器广播的心跳任务,此时可能有三种情况:

    1. 一是脑裂很快恢复,一切正常;
    2. 二是该实例已经自动过期,则重新进行注册;
    3. 三是数据冲突,出现不一致的情况,则需要发起同步请求,其实也就是重新注册一次,同时踢除老的实例。

    总之,通过集群之间的消息广播可以实现数据的最终一致性。

2.1.2 服务注册

  1. Spring Cloud Eureka 在应用启动时,会在 EurekaAutoServiceRegistration 这个类初始化的时候,主动去 Eureka Server 端注册。
  2. Eureka 在启动完成之后会启动一个 40 秒执行一次的定时任务,该任务会去监测自身的 IP 信息以及自身的配置信息是否发生改变,如果发生改变,则会重新发起注册。
  3. 续约返回 404 状态码时,会去重新注册

2.1.3 主动下线

Eureka 会在 spring 容器销毁的时候执行 shutDown 方法 ,该方法首先会将自身的状态改为 DOWN,接着发送cancle 命令至 Eureka Server 请求下掉自己的服务。

2.1.4 心跳续约与自动下线

健康检测,一般都是 TTL(Time To Live) 机制。eg: 客户端每 5s 发送心跳,服务端 15s 没收到心跳包,更新实例状态为不健康, 30s 未收到心跳包,从服务列表中删除。

Eureka Server 默认每 30s 发送心跳包,90s 未收心跳则删除。这个清理过期实例的线程,每 60s 执行一次。

2.2 崩溃恢复

2.2.1 重启

Spring Cloud Eureka 启动时,在初始化 EurekaServerBootstrap#initEurekaServerContext 时会调用 PeerAwareInstanceRegistryImpl#syncUp 从其它 Eureka 中同步数据。

2.2.2 脑裂

  • 发生脑裂后:和 Eureka Server 同区的服务可以正常访问,而不同区的服务则自动过期。
  • 脑裂恢复后:接收其它 Eureka Sever 发送过来的心跳请求,此时有三种情况:一是脑裂很快恢复,一切正常;二是该实例已经自动过期,则重新进行注册;三是数据冲突,出现不一致的情况,则需要发起同步请求。

3. 可靠性

3.1 高可用客户端(Client HA)

当有多个 Eureka Server 时,第一台宕机时会从下一台同步数据。注意:只有当第一台宕机时才会同步第二台,否则永远只会从第一台同步数据。

3.2 自我保护

如果每分钟的续约数小于阀值时 ,则开启自我保护机制,Eureka Server 将不会主动清除过期实例。


每天用心记录一点点。内容也许不重要,但习惯很重要!

最新文章

  1. 兼容各浏览器的iframe - onlaod事件
  2. android-Activity(四大组件之一)
  3. Red Hat Linux认证
  4. Linux内核OOM机制的详细分析
  5. java中关于移位运算符的demo与总结
  6. test错误记录
  7. 201521123062《Java程序设计》第2周学习总结
  8. Oracle数据库容灾备份技术探讨
  9. IIS web搭建之虚拟主机
  10. 树 相关知识总结以及Java实现
  11. 学JAVA第十一天,属性与方法
  12. iOS -- Effective Objective-C 阅读笔记 (4)
  13. SQL Server中文排序混乱
  14. 使用trash-cli防止rm -rf 误删除带来的灾难(“事前”非“事后”)
  15. Linux服务部署--Java(二)
  16. phpExcel导入大数据量情况下内存溢出解决方案
  17. Iterable接口
  18. JVM规范系列第6章:Java虚拟机指令集
  19. OTS parsing error: invalid version tag woff和ttf文件被Filter拦截
  20. Json字符串转Dictionary

热门文章

  1. shell脚本对代码执行时间的计时
  2. springCloud的使用07-----消息总线(spring cloud bus)
  3. Hibernate4教程五:事务和并发
  4. hdu 5435 A serious math problem
  5. python实现WordCount(第三次作业)
  6. 利用Kubernetes(K8S)部署JAVA项目
  7. Nginx的应用之动静分离
  8. Elasticsearch index
  9. 从Linux传输apk包到Windows系统,一周的心路历程,累
  10. Drbd+Heatbeat实现NFS共享文件存储高可用