Shell脚本实现---Swarm集群部署实例(Swarm Cluster)

一、机器环境(均是centos7.8)

IP
hostname
角色
192.168.10.200
manager-swarm
manager节点
192.168.10.201
node1-swarm
node节点
192.168.10.202
node2-swarm
node节点

1、设置主机名

在manager节点上
# hostnamectl --static set-hostname manager-swarm
在node1节点上
# hostnamectl --static set-hostname node1-swarm
在node2节点上
# hostnamectl --static set-hostname node2-swarm

2、相互域名解析(三台机都执行)

[root@manager-swarm ~]# cat >> /etc/hosts << EOF
> 192.168.10.200 manager-swarm
> 192.168.10.201 node1-swarm
> 192.168.10.202 node2-swarm
> EOF
 

3、关闭三台机器上的防火墙、selinux。

如果开启防火墙,则需要在所有节点的防火墙上依次放行2377/tcp(管理端口)、7946/udp(节点间通信端口)、4789/udp(overlay 网络端口)
# systemctl stop firewalld
# systemctl disable firewalld
# setenforce 0
# sed -i '/^SELINUX=/c SELINUX=disabled' /etc/selinux/config
 

4、在manager-swarm节点上传公钥

 

二、部署安装

# vim swarm_cluster_install.sh
#!bin/bash
#auther:sunli
#mail:<1916989848@qq.com>
manager=192.168.10.200
node1=192.168.10.201
node2=192.168.10.202 cat >> docker_install.sh << EOF
#/bin/bash
#auther:sunli
#mail:<1916989848@qq.com> #下载国内docker源,并安装
curl http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -o /etc/yum.repos.d/docker-ce.repo
yum -y install docker-ce
[ `echo $?` -ne 0 ] && echo "Please check your epel.repo" && exit #配置阿里云镜像加速器
[ ! -d /etc/docker ] && mkdir /etc/docker
cat >> /etc/docker/daemon.json <<- EOF
{
"registry-mirrors": ["https://pf5f57i3.mirror.aliyuncs.com"]
}
EOF #修改docker监听端口
#Swarm是通过监听2375端口进行通信的,所以在使用Swarm进行集群管理之前,需要设置一下2375端口的监听。所有主机节点docker开启2375,2377(swarm集群)监听,docker版本不同,配置方式不一样
sed -i '/^ExecStart/ s#.*#& -H tcp://0.0.0.0:2375 -H unix:///var/run/docker.sock#g' /usr/lib/systemd/system/docker.service #启动并设置开机自启
systemctl enable docker
systemctl start docker #拉取官方swarm镜像
docker pull swarm
EOF #用ansible给node节点传递脚本并执行
[ ! -x /usr/bin/ansible ] && yum -y install ansible
cat >> /etc/ansible/hosts << EOF
[docker]
$node1
$node2
EOF
ansible docker -m script -a 'creates=/root/docker_install.sh /root/docker_install.sh'
sh /root/docker_install.sh #创建swarm(要保存初始化后token保存至swarm_token.log
docker swarm init --advertise-addr $manager |tee swarm_token.log #添加节点到swarm集群中
swarm_token=$(sed -n '/--token/p' swarm_token.log)
ssh $node1 "$swarm_token"
ssh $node2 "$swarm_token" #在manager-swarm输出节点状态
docker node ls

执行最后输出:

 
 

三、日常运维中用到的Swarm相关命令

1) 初始化swarm manager并制定网卡地址
# docker swarm init --advertise-addr 182.48.115.237 2) 删除集群,强制退出需要加–force (针对manager节点). 到各个节点上执行退出集群的命令
# docker node rm swarm-node1
# docker swarm leave --force //manager节点退出集群,需要加--force 3) 查看swarm worker的连接令牌
# docker swarm join-token worker 4) 加入docker swarm集群,作为worker节点
利用上面3)执行结果中的命令放在其他节点上执行,则该节点加入到swarm集群中作为worker节点 5) 查看swarm manager的连接令牌
# docker swarm join-token manager 6) 加入docker swarm集群,作为manager节点
利用上面5)执行结果中的命令放在其他节点上执行,则该节点加入到swarm集群中作为manager管理节点,状态为reachable. 备注:如果之前的leader状态的manager管理节点挂了后(假如systemctl stop docker, 然后再systemctl start docker),
则新加入的manager节点状态由reachable变为leader, 之前的manager节点状态为unreachable. 7) 使旧令牌无效并生成新令牌
# docker swarm join-token --rotate 8) 查看集群中的节点
# docker node ls 9) 查看集群中节点信息
# docker node inspect swarm-node1 --pretty 10) 调度程序可以将任务分配给节点
# docker node update --availability active swarm-node1 11) 调度程序不向节点分配新任务,但是现有任务仍然保持运行
# docker node update --availability pause swarm-node1 12) 调度程序不会将新任务分配给节点。调度程序关闭任何现有任务并在可用节点上安排它们. 也就是线下节点,不参与任务分配.
# docker node update --availability drain swarm-node1 13) 添加节点标签
# docker node update --label-add label1 --label-add bar=label2 swarm-node1 14) 删除节点标签
# docker node update --label-rm label1 swarm-node1 15) 将worker节点升级为manager节点
# docker node promote swarm-node1 16) 将manager节点降级为worker节点
# docker node demote swarm-manager-node 17) 查看服务列表
# docker service ls 18) 查看服务的具体信息
# docker service ps my-test 19) 创建一个不定义name,不定义replicas的服务. (如下的nginx是docker的nginx镜像名称,不是服务名称)
# docker service create nginx 20) 创建一个指定name的服务
# docker service create --name my-nginx nginx 21) 创建一个指定name、run cmd的服务
# docker service create --name my-nginx nginx ping www.baidu.com 22) 创建一个指定name、version、run cmd的服务
# docker service create --name my-redis redis:3.0.6
# docker service create --name my-nginx nginx:1.8 /bin/bash 23) 创建一个指定name、port、replicas的服务
# docker service create --name my-nginx --replicas 3 -p 80:80 nginx 24) 为指定的服务更新一个端口
# docker service update --publish-add 80:80 my-nginx 25) 为指定的服务删除一个端口
# docker service update --publish-rm 80:80 my-nginx 26) 将redis:3.0.6更新至redis:3.0.7
# docker service update --image redis:3.0.7 redis 27) 配置运行环境,指定工作目录及环境变量
# docker service create --name my-nginx --env MYVAR=myvalue --workdir /data/www --user my_user nginx ping www.baidu.com 28) 创建一个my-nginx的服务
# docker service create --name my-nginx nginx ping www.baidu.com 29) 更新my-nginx服务的运行命令
# docker service update --args "ping www.baidu.com" my-nginx 30) 删除一个服务
# docker service rm my-nginx 31) 在每个群组节点上运行web服务
# docker service create --name tomcat --mode global --publish mode=host,target=8080,published=8080 tomcat:latest 32) 创建一个overlay网络
# docker network create --driver overlay my-network
# docker network create --driver overlay --subnet 10.10.10.0/24 --gateway 10.10.10.1 haha-network 33) 创建服务并将网络添加至该服务
# docker service create --name my-test --replicas 3 --network my-network redis 34) 删除群组网络
# docker service update --network-rm my-network my-test 35) 更新群组网络
# docker service update --network-add haha-network my-test 36) 创建群组并配置cpu和内存
# docker service create --name my_nginx --reserve-cpu 2 --reserve-memory 512m --replicas 3 nginx 37) 更改所分配的cpu和内存
# docker service update --reserve-cpu 1 --reserve-memory 256m my_nginx 38) 创建服务时自定义的几个参数
指定每次更新的容器数量
--update-parallelism
指定容器更新的间隔
--update-delay
定义容器启动后监控失败的持续时间
--update-monitor
定义容器失败的百分比
--update-max-failure-ratio
定义容器启动失败之后所执行的动作
--update-failure-action
比如:创建一个服务并运行3个副本,同步延迟10秒,10%任务失败则暂停
# docker service create --name mysql_5_6_36 --replicas 3 --update-delay 10s --update-parallelism 1 --update-monitor 30s --update-failure-action pause --update-max-failure-ratio 0.1 -e MYSQL_ROOT_PASSWORD=123456 mysql:5.6.36 39) 回滚至之前版本
# docker service update --rollback mysql
自动回滚
如果服务部署失败,则每次回滚2个任务,监控20秒,回滚可接受失败率20%
# docker service create --name redis --replicas 6 --rollback-parallelism 2 --rollback-monitor 20s --rollback-max-failure-ratio .2 redis:latest 40) 创建服务并将目录挂在至container中
# docker service create --name mysql --publish 3306:3306 --mount type=bind,src=/data/mysql,dst=/var/lib/mysql --replicas 3 -e MYSQL_ROOT_PASSWORD=123456 mysql:5.6.36
需要注意使用bind绑定宿主机目录会带来的风险
- 绑定的主机路径必须存在于每个集群节点上,否则会有问题;
- 调度程序可能会在任何时候重新安排运行服务容器,如果目标节点主机变得不健康或无法访问;
- 主机绑定数据不可移植,当你绑定安装时,不能保证你的应用程序开发方式与生产中的运行方式相同; 41) 添加swarm配置
# echo "this is a mysql config" | docker config create mysql - 42) 查看配置
# docker config ls 查看配置详细信息
# docker config inspect mysql 43) 删除配置
# docker config rm mysql 44) 添加配置
# docker service update --config-add mysql mysql 45) 删除配置
# docker service update --config-rm mysql mysql 46) 添加配置
# docker config create kevinpage index.html 47) 启动容器的同时添加配置(target如果报错,就使用dst或destination)
# docker service create --name nginx --publish 80:80 --replicas 3 --config src=kevinpage,target=/usr/share/nginx/html/index.html nginx
 

遇到问题记录:

1、删除节点报错
Error response from daemon: rpc error: code = FailedPrecondition desc = node krngsansedm5pr6e6dziscs4e is not down and can't be removed
解决方法如下: -f 强制删除
# docker node rm -f node1-swarm
 
2、添加节点报错
Error response from daemon: This node is already part of a swarm. Use "docker swarm leave" to leave this swarm and join another one.
解决方法如下:根据提示先执行# docker swarm leave,再输入work节点令牌
 

最新文章

  1. ios设备mdm的实现过程
  2. Lucene系列-近实时搜索(1)
  3. 完整的社交app源码android+laravel
  4. Drupal 7.31SQL注入getshell漏洞利用详解及EXP
  5. [转]C#创建Windows服务与安装
  6. First Position of Target
  7. CSS+DIV:父DIV相对定位+子DIV绝对定位
  8. jquery form提交
  9. bzoj4035 [HAOI2015]数组游戏
  10. vue项目报错webpackJsonp is not defined
  11. 用vue脚手架创建bootstrap-vue项目
  12. Linux 文件内容查看(cat、tac、nl 、more 、less、head、tail )
  13. maven scope使用和理解
  14. 设计原则之依赖倒置js
  15. PHP提取HTML代码中img标签下src属性
  16. WebRTC源码分析(一):安卓相机采集实现分析
  17. echarts.js多图表数据展示使用小结
  18. position fixed 居中
  19. L1-046. 整除光棍(模拟竖式计算除法)
  20. ORACLE创建映射

热门文章

  1. 函数的arguments对象的使用和介绍
  2. Python-输入输出-input ouput
  3. 087 01 Android 零基础入门 02 Java面向对象 02 Java封装 01 封装的实现 01 封装的概念和特点
  4. matplotlib.pyplot.imshow如何显示灰度图
  5. C++派生类与基类的关系
  6. 插头 dp
  7. 编程体系结构(07):JavaEE之Web开发
  8. DX12龙书 00 - 环境配置:通过 Visual Studio 2019 运行示例项目
  9. dict, hash
  10. 扫描仪扫描文件处理-Photoshop批处理无响应问题