mydumper介绍

MySQL自身的mysqldump工具支持单线程工作,依次一个个导出多个表,没有一个并行的机,这就使得它无法迅速的备份数据。

mydumper作为一个实用工具,能够良好支持多线程工作,可以并行的多线程的从表中读入数据并同时写到不同的文件里,这使得它在处理速度方面快于传统的mysqldump。其特征之一是在处理过程中需要对列表加以锁定,因此如果我们需要在工作时段执行备份工作,那么会引起DML阻塞。但一般现在的MySQL都有主从,备份也大部分在从上进行,所以锁的问题可以不用考虑。这样,mydumper能更好的完成备份任务。

mydumper特性

  • 多线程备份
  • 因为是多线程逻辑备份,备份后会生成多个备份文件
  • 备份时对MyISAM表施加FTWRL(FLUSH TABLES WITH READ LOCK),会阻塞DML语句
  • 保证备份数据的一致性
  • 支持文件压缩
  • 支持导出binlog
  • 支持多线程恢复
  • 支持以守护进程模式工作,定时快照和连续二进制日志
  • 支持将备份文件切块

mydumper的安装

mydumper使用c语言编写,使用glibc库

mydumper安装所依赖的软件包,glibc, zlib, pcre, pcre-devel, gcc, gcc-c++, cmake, make, mysql客户端库文件

  1. 安装依赖软件包,将mysql客户端库文件路径添加至/etc/ld.so.conf, 如/usr/local/mysql/lib
  2. 解压软件包进入目录,cmake .
  3. make && make install

安装完成后生成两个二进制文件mydumper和myloader位于/usr/local/bin目录下

mydumper备份机制

mydumper工作流程图

主要步骤概括

  1. 主线程 FLUSH TABLES WITH READ LOCK, 施加全局只读锁,以阻止DML语句写入,保证数据的一致性
  2. 读取当前时间点的二进制日志文件名和日志写入的位置并记录在metadata文件中,以供即使点恢复使用
  3. N个(线程数可以指定,默认是4)dump线程 START TRANSACTION WITH CONSISTENT SNAPSHOT; 开启读一致的事物
  4. dump non-InnoDB tables, 首先导出非事物引擎的表
  5. 主线程 UNLOCK TABLES 非事物引擎备份完后,释放全局只读锁
  6. dump InnoDB tables, 基于事物导出InnoDB表
  7. 事物结束

备份所生成的文件

  • 所有的备份文件在一个目录中,目录可以自己指定
  • 目录中包含一个metadata文件

    记录了备份数据库在备份时间点的二进制日志文件名,日志的写入位置,

    如果是在从库进行备份,还会记录备份时同步至主库的二进制日志文件及写入位置

  • 每个表有两个备份文件:

    database.table-schema.sql 表结构文件

    database.table.sql 表数据文件

    如果对表文件分片,将生成多个备份数据文件,可以指定行数或指定大小分片

mydumper和myloader的使用

mydumper参数

-B, --database              要备份的数据库,不指定则备份所有库
-T, --tables-list 需要备份的表,名字用逗号隔开
-o, --outputdir 备份文件输出的目录
-s, --statement-size 生成的insert语句的字节数,默认1000000
-r, --rows 将表按行分块时,指定的块行数,指定这个选项会关闭 --chunk-filesize
-F, --chunk-filesize 将表按大小分块时,指定的块大小,单位是 MB
-c, --compress 压缩输出文件
-e, --build-empty-files 如果表数据是空,还是产生一个空文件(默认无数据则只有表结构文件)
-x, --regex 是同正则表达式匹配 'db.table'
-i, --ignore-engines 忽略的存储引擎,用都厚分割
-m, --no-schemas 不备份表结构
-k, --no-locks 不使用临时共享只读锁,使用这个选项会造成数据不一致
--less-locking 减少对InnoDB表的锁施加时间(这种模式的机制下文详解)
-l, --long-query-guard 设定阻塞备份的长查询超时时间,单位是秒,默认是60秒(超时后默认mydumper将会退出)
--kill-long-queries 杀掉长查询 (不退出)
-b, --binlogs 导出binlog
-D, --daemon 启用守护进程模式,守护进程模式以某个间隔不间断对数据库进行备份
-I, --snapshot-interval dump快照间隔时间,默认60s,需要在daemon模式下
-L, --logfile 使用的日志文件名(mydumper所产生的日志), 默认使用标准输出
--tz-utc 跨时区是使用的选项,不解释了
--skip-tz-utc 同上
--use-savepoints 使用savepoints来减少采集metadata所造成的锁时间,需要 SUPER 权限
--success-on- Not increment error count and Warning instead of Critical in case of table doesn't exist
-h, --host 连接的主机名
-u, --user 备份所使用的用户
-p, --password 密码
-P, --port 端口
-S, --socket 使用socket通信时的socket文件
-t, --threads 开启的备份线程数,默认是4
-C, --compress-protocol 压缩与mysql通信的数据
-V, --version 显示版本号
-v, --verbose 输出信息模式, = silent, = errors, = warnings, = info, 默认为

myloader使用参数

-d, --directory                   备份文件的文件夹
-q, --queries-per-transaction 每次事物执行的查询数量,默认是1000
-o, --overwrite-tables 如果要恢复的表存在,则先drop掉该表,使用该参数,需要备份时候要备份表结构
-B, --database 需要还原的数据库
-e, --enable-binlog 启用还原数据的二进制日志
-h, --host 主机
-u, --user 还原的用户
-p, --password 密码
-P, --port 端口
-S, --socket socket文件
-t, --threads 还原所使用的线程数,默认是4
-C, --compress-protocol 压缩协议
-V, --version 显示版本
-v, --verbose 输出模式, = silent, = errors, = warnings, = info, 默认为2

使用案例
备份game库到/backup/01文件夹中,并压缩备份文件

mydumper
-u root -p ### -h localhost -B game -c -o /backup/01

备份所有数据库,并备份二进制日志文件,备份至/backup/02文件夹

mydumper
-u root -p ### -h localhost -o /backup/02

备份game.tb_player表,且不备份表结构,备份至/backup/03文件夹

mydumper
-u root -p ### -h localhost -T tb_player -m -o /backup/03

还原

mysqlload
-u root -p ### -h localhost -B game -d /backup/02

mydumper的less locking模式

mydumper使用--less-locking可以减少锁等待时间,此时mydumper的执行机制大致为

  • 主线程 FLUSH TABLES WITH READ LOCK
    (全局锁)
  • Dump线程 START TRANSACTION WITH CONSISTENT
    SNAPSHOT;
  • LL Dump线程 LOCK TABLES non-InnoDB
    (线程内部锁)
  • 主线程UNLOCK TABLES
  • LL Dump线程 dump non-InnoDB tables
  • LL DUmp线程 UNLOCK non-InnoDB
  • Dump线程 dump InnoDB tables

最新文章

  1. Javascript的shift()和push(),unshift()和pop()方法简介
  2. mac OS X Yosemite (10.10.5) 下 安装vim 7.4笔记
  3. 清除SVN版本控制文件
  4. 《隆重介绍 思源黑体:一款Pan-CJK 开源字体》
  5. 多列布局——column-count
  6. Android Drawable的9种子类 介绍
  7. poj 1664
  8. Struts2 的ModelDriven理解
  9. python3抓取异步百度瀑布流动态图片(二)get、json下载代码讲解
  10. Mahout应用(一)
  11. 201521123017 《Java程序设计》第6周学习总结
  12. Postgresql基本用法以及优化注意
  13. 使用walle部署laravel的时候问题记录
  14. ACM计划
  15. Fiddler响应post的请求 request body
  16. Python读取大文件的"坑“与内存占用检测
  17. Servlet之ServletContext获取web上下文路径、全局参数、和Attribute(域)
  18. 一本通1645Fibonacci
  19. 听说玩JAVA,必须过JDK这关?
  20. Problem B. Harvest of Apples 莫队求组合数前缀和

热门文章

  1. 神级程序员通过两句话带你完全掌握Python最难知识点——元类!
  2. linux 命令收集 阿里云nginx升级等 查看磁盘空间 版本等
  3. Unity3d跨平台原理
  4. SSH 互信
  5. luogu P4074 [WC2013]糖果公园
  6. 错误RSA host key for [ip address] has changed and you have requested strict checking.
  7. G - 楼房重建 (线段树)
  8. JavaScript学习 - 基础(一)
  9. 【CXF】: No binding operation info while invoking unknown method with params unknown.
  10. groovy与java中的多方法