MHA概念介绍,群集搭建与测试

一, MHA介绍

1.概念:MHA master high availability,由日本DeNA公司开发,解决mysql故障切换可以做到0-30秒,而且在故障切换过程中,能最大限度保障数据的一致性,实现真正的高可用.

2.组成:管理节点(MHA manager),管理所有数据库服务器,可以部署于一台独立的主机,也可以与某台数据库服务器共用一台主机;数据节点(MHA node),运行在每台存储数据的服务器上.

3.原理:由manager探测集群中的master节点; 当master故障时,manager自动将拥有最新数据的从库提升为新的master.

二,搭建MHA群集

1.拓扑图

2.部署环境

- 准备3台数据库服务器4.51,4.52,4.53,配置为一主多从结构(4.51为主库,4.52和4.53为从库),并且相互之间可以用root无密码登录.

-实现无密码登录的方式:(3台服务器上都需要重复4.51的动作)

例,在主机4.51上操作:#ssh-keygen -f /root/.ssh_rsa -N ‘’   //生成秘钥

#for i in 51 52 53   //拷贝秘钥到其它主机

do

ssh-copy-id root@192.168.4.$i

done

- 准备2台虚拟机:主机4.57做管理节点manager,主机4.50做客户端client.

- 在主机4.50,4.51,4.52,4.53,4.57上安装系统自带的软件perl-*

- 管理节点4.57可以用root用户无密码登录3台数据库服务器4.51,4.52,4.53.

- 所有主机安装共享的perl软件包(从真机上scp文件夹mha-soft-student->cd进入文件夹->yum安装perl-* )

- rpm -qa|grep perl|wc -l //查看安装的perl软件包数量是否为382个

3.安装管理节点的软件

#cd mha-soft-student/  进入文件夹

cd mha-soft-student]# rpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm //安装连接服务器节点的软件

# tar -xvf mha4mysql-manager-0.56.tar.gz      //解压管理软件包

# cd mha4mysql-manager-0.56                //进入文件夹

mha4mysql-manager-0.56]# perl Makefile.PL  //指定目标文件,检查安装环境

mha4mysql-manager-0.56]# make           //编译源码

mha4mysql-manager-0.56]# make install    //编译并安装

#ls /root/perl5/bin/masterha_*              //查看安装的管理集群的命令

4.编写主配置文件app1.cnf

# mkdir /etc/mha  //创建新目录,以存储配置文件(不在系统默认配置文件的目录下操作)

#cd mha-soft-student   //进入文件夹

mha-soft-student]# cp mha4mysql-manager-0.56/samples/conf/app1.cnf  /etc/mha/                     //将系统配置文件拷贝到新建目录/etc/mha

mha-soft-student]# vim /etc/mha/app1.cnf  //编辑配置文件

[server default]               //管理服务器的默认配置

manager_workdir=/etc/mha         //工作目录

manager_log=/etc/mha/manager.log        //工作日志

master_ip_failover_script=/etc/mha/master_ip_failover   //故障切换脚本

ssh_user=root               //访问ssh服务的用户

ssh_port=22                 //ssh服务端口

repl_user=repluser           //主库同步到从库的授权用户

repl_password=123qqq...A   //主库同步到从库的授权密码

user=root                    //manager登录数据库服务器使用的用户

password=123qqq...A        //manager登录数据库服务器使用的密码

[server1]                   //指定第1台数据库服务器

hostname=192.168.4.51   //数据库服务器IP地址

port=3306                 //服务端口

candidate_master=1       //竞选主机,当主库故障时,其它的从库参入新主库的竞选

[server2]                  //指定第2台数据库服务器

hostname=192.168.4.52  //数据库服务器IP地址

port=3306                //服务端口

candidate_master=1

[server3]                  //指定第3台数据库服务器

hostname=192.168.4.53  //数据库服务器IP地址

port=3306                //服务端口

candidate_master=1      //竞选主机,当主库故障时,其它的从库参入新主库的竞选

5.在管理节点4.57上创建故障切换脚本master_ip_failover

#cp mha-soft-student/master_ip_failover  /etc/mha/

#vim /etc/mha/master_ip_failover

my $vip = '192.168.4.100/24';  #定义VIP

my $key = "1";   //定义地址编号

my $ssh_start_vip = "/sbin/ifconfig eth0:$key $vip";   //绑定VIP地址

my $ssh_stop_vip = "/sbin/ifconfig eth0:$key down";  //释放VIP地址

# chmod +x /etc/mha/master_ip_failover   //赋予权限 ,这一步很重要,漏掉会导致集群起不来.

6.在主库4.51上部署vip

# ifconfig eth0:1 192.168.4.100    //设置VIP

# ifconfig eth0:1     //查看VIP,谁是主库,谁就拥有VIP

client ~]# ping -c2 192.168.4.100  //客户端ping一下连接状态

7.在从库4.52,4.53上配置数据节点

[root@db51 mha-soft-student]# for i in 51 52 53  //安装连接节点的软件

> do

>ssh 192.168.4.$i "yum -y install /root/mha-soft-student/mha4mysql-node-0.56-0.el6.noarch.rpm"

> done

mysql> grant replication slave on *.* to repluser@"%" identified by "123qqq...A";  //在从库4.52,4.53上授权用户repluser及密码

mysql> grant all on *.* to root@"%" identified by "123qqq...A"; //在3台数据库4.57上授权管理节点监控数据库时使用的连接用户及密码

8.主库加载master,slave模块

[mysqld]

log-bin=db51    //启用log-bin日志

server_id=51

plugin-load="rpl_semi_sync_master=semisync_master.so;rpl_semi_sync_slave=semisync_slave.so"  //加载模块

rpl_semi_sync_master_enabled=1  //启用master模块

rpl_semi_sync_slave_enabled=1    //启用slave模块

relay_log_purge=0     //禁止软件自动删除中继日志文件

#systemctl restart mysqld   //重启,加载配置

9.从库4.52加载master,slave模块

[mysqld]

server_id=52

log-bin=master52    //启用log-bin日志

relay_log_purge=0   //禁止软件自动删除中继日志文件

plugin-load="rpl_semi_sync_master=semisync_master.so;rpl_semi_sync_slave=semisync_slave.so"   //加载模块

rpl_semi_sync_master_enabled=1    //启用master模块

rpl_semi_sync_slave_enabled=1     //启用slave模块

#systemctl restart mysqld    //重启,加载配置

10.从库4.53加载master,slave模块

[mysqld]

server_id=53

log_bin=master53    //启用log-bin日志

relay_log_purge=0   //禁止软件自动删除中继日志文件

plugin-load="rpl_semi_sync_master=semisync_master.so;rpl_semi_sync_slave=semisync_slave.so"   //加载模块

rpl_semi_sync_master_enabled=1   //启用master模块

rpl_semi_sync_slave_enabled=1    //启用slave模块

#systemctl restart mysqld

11.测试一下数据库主从是否同步

mysql-uroot -p123qqq...A -e ‘insert into db1.t1 values(6,”wangwu”,30)’ //在主库4.51上插入数据

[root@db51 ~]# for i in 52 53   //查看从库是否同步数据

> do

> ssh root@192.168.4.$i 'mysql -uroot -p123qqq...A -e "select * from db1.t1"'

> done

三,测试MHA群集

1.在管理节点上测试ssh配置

[root@db57 ~]# masterha_check_ssh --conf=/etc/mha/app1.cnf

Thu Jun 20 15:30:08 2019 - [info] All SSH connection tests passed successfully.

2.在管理节点上测试主从同步

[root@db57 ~]# masterha_check_repl --conf=/etc/mha/app1.cnf

MySQL Replication Health is OK

3.启动masterha_manager服务

[root@db57 ~]# masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf  --ignore_last_failover

--remove_dead_master_conf //主库故障时,删除管理节点配置文件中的server主机

--ignore_last_failover //软件默认故障发生时,有一个切换时间.加载该选项可以实现时间点无缝切换.

4.在主库4.51添加访问数据的连接用户及密码,并同步到4.52和4.53

mysql> create database db9;

mysql> create table db9.a(id int,name char(10));

mysql> grant select,insert on db9.* to yaya55@"%" identified by '123qqq...A';

# mysql -uroot -p123qqq...A -e 'select host,user from mysql.user where user="yaya55";'  //分别在4.52和4.53查看授权的用户yaya55

5.客户端登录插入数据

[root@client ~]# mysql -h192.168.4.100 -uroot -p123qqq...A

mysql> insert into db9.a values(1,"lisi");

mysql> insert into db9.a values(2,"wangwu");

mysql> select * from db9.a;

+------+--------+

| id   | name   |

+------+--------+

|    1 | lisi   |

|    2 | wangwu |

+------+--------+

2 rows in set (0.00 sec)

# mysql -uroot -p123qqq...A -e ‘select * from db9.a’ //分别在4.52和4.53上查看插入的数据

6.测试高可用

思路:停止4.51的mysql服务->管理节点4.57会监控到master4.51发生故障,并停止监控服务,触发故障脚本master_ip_failover在2台从库中竞选出新的master主机,数据库服务不会停止->客户端连接到vip,依然可以访问数据库,做读写操作.

6.1停止主库4.51的mysql服务

[root@db51 ~]# systemctl stop mysqld

6.2客户端再次登录vip

[root@client ~]# mysql -h192.168.4.100 -uroot -p123qqq...A

6.3插入数据,并查看

mysql> insert into db9.a values(3,"jack");

mysql> select * from db9.a;  //在主机4.52和4.53上查看插入的数据

6.4 配置文件/etc /mha/aqq1.cnf中的[server1]容器被删除,即主机4.51被踢出了服务序列,具体见下图:

7.将down机的4.51重新添加入集群服务序列

7.1启动数据库4.51

#systemctl start mysqld

7.2把4.51配置为当前集群的从服务器

7.2.1把新主库4.52的数据备份,并在4.51上恢复,以确保与主服务器数据保持一致.

[root@db52 ~]# mysqldump -uroot -p123qqq...A --master-data db9 > db9.sql //主库备份数据

[root@db52 ~]# scp db9.sql root@192.168.4.51:/root/  //上传数据给4.51

[root@db51 ~]# mysql -uroot -p123qqq...A db9 < /root/db9.sql  //在主机4.51上恢复数据

7.2.2定义从库信息,启动slave进程,查看状态

mysql> change master to

->master_host="192.168.4.52",master_user="repluser",master_password="123qqq...A",

-> master_log_file="master52.000002",master_log_pos=154;

//定义从库信息

mysql> start slave;

[root@db51 ~]# mysql -uroot -p123qqq...A -e "show slave status\G"|head -13

//查看已经定义的从库信息

*************************** 1. row ***************************

Slave_IO_State: Waiting for master to send event

Master_Host: 192.168.4.52

Master_User: repluser

Master_Port: 3306

Connect_Retry: 60

Master_Log_File: master52.000002

Read_Master_Log_Pos: 154

Relay_Log_File: db51-relay-bin.000002

Relay_Log_Pos: 319

Relay_Master_Log_File: master52.000002

Slave_IO_Running: Yes

Slave_SQL_Running: Yes

7.3 将主机4.51添加到集群配置文件中

7.3.1停止管理节点4.57的监控服务

[root@db57 ~]# masterha_stop --conf=/etc/mha/app1.cnf

7.3.2添加主机4.51的server到集群配置文件/etc/mha/app1.cnf

[server1]

candidate_master=1

hostname=192.168.4.51

port=3306

7.3.3管理节点做启动前的ssh和repl检测

[root@db57 ~]# masterha_check_ssh --conf=/etc/mha/app1.cnf

[info] All SSH connection tests passed successfully.

[root@db57 ~]# masterha_check_repl --conf=/etc/mha/app1.cnf

MySQL Replication Health is OK.

7.3.4启动管理节点,监控数据库服务器

[root@db57 ~]# masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover

[root@db57 ~]# masterha_check_status --conf=/etc/mha/app1.cnf

app1 (pid:1991) is running(0:PING_OK), master:192.168.4.52

四,总结

必须配置实现ssh无密码登录(数据库服务器之间,管理节点与数据库服务器之间)

必须配置主从同步结构

必须设置VIP地址

down机的服务器需要人为配置为集群从服务器,才能重新添加到集群服务序列.

down机的服务器不能自动同步down机期间的数据(缺点)

在主从同步结构中,没有从服务器时,不能实现故障切换.

结束.

最新文章

  1. 【65测试20161114】【字符串】【DP】
  2. WKInterfaceImage 无法更新图片的问题
  3. Scala函数式编程进阶
  4. perl常用代码
  5. hosts文件配置作用
  6. bzoj 2761 [JLOI2011]不重复数字(哈希表)
  7. Object-C 重载
  8. crt连接vitualbox中centos虚拟机
  9. POJ 2239 Selecting Courses
  10. php类中双冒号和-&gt;的区别
  11. err:安装程序试图挂载映像 1(缺少ISO 9660图像)
  12. JAVA面试题集
  13. 用Docker解决坑爹的环境搭建系列——postgresql
  14. select获取选中的option(包含value和text,重点是text怎么获取)
  15. GA:利用GA对一元函数进行优化过程,求x∈(0,10)中y的最大值——Jason niu
  16. angular2--Tour of Heroes学习和分析--路由
  17. ES6语法(3)—— 用promise()对象优雅的解决异步操作
  18. 团购已满,O2O只是个笑话吗?
  19. JavaScript:正则表达式 问号
  20. HTTP协议中TCP的三次握手 and HTTPS

热门文章

  1. JMeter-性能测试之报表设定的注意事项
  2. jquery用法初探
  3. shell学习----正则表达式
  4. JS中的Date对象
  5. hud 4347 The Closest M Points(KD-Tree)
  6. Linux下MySQL 5.5的修改字符集编码为UTF8(彻底解决中文乱码问题)
  7. CSS3中哪些新属性—阴影、文本省略(1)
  8. 2017数据科学报告:机器学习工程师年薪最高,Python最常用
  9. Jenkins使用三:管理slave节点(配置SSH公钥和私钥)
  10. Looper,Handler, MessageQueue