这是ZK学习笔记的下篇, 主要希望可以分享一些 ZK 的应用以及其应用原理

我本人的学习告一段落, 不过还遗留了一些ZK相关的任务开发和性能测试的任务, 留待以后完成之后再通过其他文章来进行分享了


ZK应用场景:

1. 一个服务多台机器, 快速修改配置
2. 服务的消费者如何动态知道服务有多少个提供者
3. 生产系统部署多少个业务系统以及每个业务系统提供多少接口

ZK案例-配置管理:

服务端:
每次启动, 会将提供的request都注册到 ZK 中 客户端:
启动时读取 ZK 中所有的 service 提供者,并且组装出可用的 service 优化:
服务器启动注册本地IP,使用临时节点的方式, 一旦连接失效, 客户端可以收到节点消失的通知

ZK案例-分布式锁

排他锁:只能一个线程获取.其他线程需要等待
ZK实现:
获得锁:构建目录, 叶子节点创建成功则认为获取锁 排他锁实现的核心思想:
通过只有一个线程可以创建一个同样的叶子节点进行实现
线程可以成功创建叶子节点即认为获取锁成功,可以执行业务代码
若线程无法成功创建叶子节点,则认为获取锁失败, 需要进入等待, 多个其他线程创建失败则多个线程进入等待
线程执行完业务代码会删除叶子节点,其他线程获取到删除通知,会释放线程,再次尝试获取锁 共享锁:可以多个读操作同时获取锁进行处理,一旦出现写锁,其他所有操作需要等待写入完成之后重新获取锁
ZK实现:
读时可以允许其他线程进行读, 写是其他线程不可进行其他操作
共享锁实现的核心思想:
每个节点都向ZK写入节点信息(Seq节点)
通过排名比较是否自己在第一个来进行判断是否获取到锁
非第一个,则在本身和前面都是读锁的情况下才可以继续,否则获取失败,进入等待 性能如何(待测试...)?
在连续不断有请求到达时,最大TPS有多少, 区分同时有 10个线程竞争和同时有 100个线程竞争的时候

ZK的使用和运维

ZK 配置说明:

  1. 基于log4j的日志配置:

    运行命令行增加: ZOO_LOG_DIR

  2. zoo.conf

     dataLogDir : 事务日志文件存储目录, 高并发下, 和 dataDir 配置在不同磁盘上, 提高 IO
    snapCount : 两次事务日志的记录数量
    preAllocSize : 默认64MB, 与 snapCount相关,
    minSessionTimeout , maxSessionTimeout : 2倍和20倍 ticktime
    maxClientCnxns: socket层限制客户端和单台服务器的并发连接数, 只控制单台机器,不能控制总连接
    Jute.maxbuffer:配置单个节点最大数据大小, 默认10MB, 需要客户端和服务端同时配置生效
    Autopurge.snapRetainCount: 自动清理快照和事务日志需要保留文件数
    Autopurge.purgeInterval:清理的周期
    fsync.warningthresholdms:事务日志刷新到磁盘的阈值, 默认1000ms , fsync超过此时间会报警
    forceSync : 日志提交时是否强制刷磁盘, 默认true, 可以false
  3. 四字命令:

    通过 telnet ip port 进入 , 打印命令

    通过 nc 进入: echo 命令 |nc localhost port

     conf : 查看配置
    cons : 输出当前客户端所有连接的详细信息
    queued : 待处理的请求
    recved : 接受到的
    sent : 已处理的
    sid
    lop : 最近操作 crst : 重置客户端连接统计信息
    dump : 当前集群所有会话信息, 包括id, 临时节点, 会话超时时间(leader节点)
    envi : 运行时当前环境信息
    ruok : 输出zk服务器运行是否正常
    stat : 服务端运行状况, zk服务版本, 延迟, 节点信息等
    srvr : 类似 stat , 无会话信息
    srst : 重置服务端统计信息
    wchs : 输出服务器管理的 watcher 的概要信息, zk构造器创建的 watcher 不会被计入统计中
    wchc : 管理的 watcher 的详细信息, 以 session 为视角
    wchp : 以node为视角
    mntr : 比 stat 更详细, 包括请求的延迟情况, 服务区内存大小, 集群同步等...
  4. 性能优化:

     JVM优化
    IO优化
    加大 linux系统的文件句柄数和用户线程数, linux 通过 ulimit 查看配置
    业务并发高: 客户创建多个客户端连接, 用于不同的业务
    减少资源消耗, 比如watcher的数量
    提高带宽
  5. 扩容:

     停机:直接增加节点
    不停机:
    新增节点: id需要比集群更大
    新节点启动, 加入集群且同步数据
    mntr查看新的节点数据成功同步后再执行
    依次id从小到大,关闭zk实例,修改配置,启动实例
  6. 监控:

     zookeeper的事务日志
    磁盘IO
    日志清理:建议定期清理事务日志和快照文件
    连接数,避免过多
    watchers 数量
    ZK通知延时是否过大

ZK运维系统

Taokeeper:

功能:
CPU
ZK日志目录磁盘空间监控
单机连接数
单机Watcher数量
节点健康状态
少量统计报表
不足:
目录查看
网络流量
磁盘IO监控
安装:
源码安装:
包安装:
初始化脚本:4张表sql 安装步骤:
1. 修改机器,增加host
zk1node
zk2node
zk3node 个人意见: 无法达到生产使用的标准, 建议自行开发相应的监控系统, 或者运维人员通过四字命令手工监控

====自己总结=

  1. 一些资料

    Zookeeper 学习

     http://www.open-open.com/lib/view/open1415453633887.html

    zookeeper简介

     http://www.open-open.com/lib/view/open1415453633887.html

    ZK的应用,可以再细化:

     http://blog.csdn.net/xinguan1267/article/details/38422149
    http://cailin.iteye.com/blog/2014486/ (原理)
  2. 心得

    Zookeeper 的使用场景

     Zookeeper完全可以解决我们的问题,分布式计算中的协调员,观察者,分布式锁  都可以作为zookeeper的关键词
    在系统中利用Zookeeper来处理事件通知,队列,优先队列,锁,共享锁等功能,利用这些特色在分布式计算中发挥重要的作用。 Zookeeper 可以做配置的动态更新(通知机制) 配置管理 & 集群服务管理
    所有节点登录后, 自行获取配置(公共的,特有的(通过serviceId标示))
    一般节点启动后负责在 某 path 中写入自身的service等标志, 如果已有则不再启动
    管理节点启动后负责获取所有其他节点写入的一些数据, 来确定有多少其他节点正在工作

    一些疑问:

     是否可以用于进行业务监控和系统监控 ?
    数据是否可以序列处理? 是否有乱序 ? 写入 ZK 的效率如何 ? 一个 ZK集群, 单个client 最快写入效率?20个节点,最快写入效率如何?
    如果一个节点的数据更新了, client端获取到watcher 事件, 但是还未处理完, 节点数据又更新了, 是否可能发生? 应该如何处理呢?
    server 端直接关闭, 会有何情况 ?
    会导致连接上的客户端, 不断重试连接; 如果client 进行连接时, server 还未ready, 则会一直重试, 一旦 server ok ,则连接会成功
    集群如果对应的 myid 不在, 会报错, zoo.cfg 读取失败
  3. Todo :

    • ZK 源码查看

        服务端的启动
      服务端的整体结构
      客户端的连接
      服务端接收到各类事件的处理
      事务日志的写入
      快照的写入
    • ZK 的应用开发

        1) 设想 ET, 将配置文件存在ZK中,启动时读取,且响应更新 ; 以API jar 的方式提供, 可以用于各个项目中获取
      2) ZK 节点数据界面可视化开发
      3) 监控工具打造:应用通过ZK将数据传入,监控工具从ZK中获取各个更新数据
    • Zookeeper 的性能压力测试

        1) 单个client, 针对单个节点的连续写入能力,测试写入性能, 另外配合一个client注册watcher, 看是否可以连续获取到更新的数据
      2) 单个client, 针对打个节点不断写入子节点,测试写入性能, 另外注册 watcher , 看是否可以获取到更新的事件
      3) 使用场景有些类似于 MQ 的使用, 对于ZK读取数据的性能测试

最新文章

  1. bzoj2500: 幸福的道路(树形dp+单调队列)
  2. lightoj1348
  3. Linux设备驱动模型之I2C总线
  4. android 常见的泄漏内存方法和 leakcanary 使用方法
  5. iOS中使用FMDB事务批量更新数据库
  6. asp遇到的一些问题
  7. HDU 4712 Hamming Distance(随机算法)
  8. 【转】单双精度浮点数的IEEE标准格式
  9. css案例学习之ul li dl dt dd实现二级菜单
  10. C++指针数组和指向指针的指针
  11. UVa1587 盒子
  12. 异常处理-try catch
  13. 通过Performance Log确定磁盘有性能问题?
  14. wince可用的7-zip
  15. Linux 进程同步和通信
  16. resmgr:cpu quantum 等待事件 top 1
  17. bzoj4504 K个串 (优先队列+主席树)
  18. VC++常用数据类型
  19. HDU 1159:Common Subsequence(LCS模板)
  20. NOIP 2017 d2t2 70points

热门文章

  1. kafka window安装与配置
  2. 转 实例具体解释DJANGO的 SELECT_RELATED 和 PREFETCH_RELATED 函数对 QUERYSET 查询的优化(二)
  3. 杂项-PIN:百科
  4. set_option()函数
  5. robotframework之使用cookies登陆
  6. 关于在DBGridEh的一个字段使用checkbox的方法 .
  7. Golang http post error : http: ContentLength=355 with Body length 0
  8. python使用相对路径创建文件夹
  9. ARTS-1
  10. Cocos2d-X网络编程(3) Cocos2d中的网络通信协议——WebSocket协议