MySQL -- 数据恢复

栏目: 数据库 · 发布时间: 7年前

内容简介：《MySQL实战45讲》转载请注明出处：http://zhongmingmao.me/2019/03/04/mysql-data-recovery/

使用 DELETE 语句误删除了 数据行 ，可以使用 Flashback 通过闪回把数据恢复
Flashback 恢复数据的原理：修改 binlog 的内容，然后拿到 原库重放
- 前提： binlog_format=ROW 和 binlog_row_image=FULL
针对单个事务
- 对于 INSERT 语句，将 Write_rows event 改成 Delete_rows event
- 对于 DELETE 语句，将 Delete_rows event 改成 Write_rows event
- 对于 UPDATE 语句， binlog 里面记录了数据行修改前和修改后的值， 对调两行的位置即可
针对多个事务
- 误操作
  - (A)DELETE
  - (B)INSERT
  - (C)UPDTAE
- Flashback
  - (REVERSE C)UPDATE
  - (REVERSE B)DELETE
  - (REVERSE A)INSERT
不推荐直接在主库上执行上述操作，避免造成 二次破坏
- 比较安全的做法是先恢复出一个备份或找一个从库作为 临时库
- 在临时库上执行上述操作，然后再将 确认过 的临时库的数据，恢复到主库
预防措施
- sql_safe_updates=ON ，下列情况会报错
  - 没有 WHERE 条件的 DELETE 或 UPDATE 语句
  - WHERE 条件里面 没有包含索引字段的值
- 上线前，必须进行 SQL审计
删全表的性能
- DELETE 全表很慢，因为需要生成 undolog 、写 redolog 和写 binlog
- 优先考虑使用 DROP TABLE 或 TRUNCATE TABLE

DROP / TRUNCATE

DROP TABLE 、 TRUNCATE TABLE 和 DROP DATABASE ，是无法通过 Flashback 来恢复的
- 即使配置了 binlog_format=ROW ，执行上面3个命令， binlog 里面记录的依然是 STATEMENT 格式
- binlog 里面只有一个 TRUNCATE/DROP 语句，这些信息是无法恢复数据的
这种情况如果想要恢复数据，需要使用 全量备份 和 增量日志 的方式
- 要求线上 定期全量备份 ，并且 实时备份 binlog

mysqlbinlog

假设有人中午12点删除了一个库，恢复数据的流程

取最近一次全量备份，假设一天一备，即当天0点的全量备份
用全量备份恢复出一个临时库
从 binlog 备份里，取出凌晨0点以后的日志
把这些日志， 除误删数据的语句外 ，全部应用到临时库
为了 加快数据恢复 ，如果临时库上有多个数据库，可以加上 --database 参数，指定应用某个库的日志
跳过12点误操作语句的 binlog
- 如果原实例没有使用 GTID 模式，只能在应用到包含12点的 binlog 文件的时候
  - 先用 --stop-position 参数执行到 误操作之前 的日志
  - 再用 --start-position 从 误操作之后 的日志继续执行
- 如果原实例使用 GTID 模式，假设误操作命令的 GTID 为 gtid1
  - 只需执行 SET gtid_next=gtid1;BEGIN;COMMIT;
  - 把 gtid1 加入到临时库的 GTID 集合，之后按顺序执行 binlog 时，会 自动跳过 误操作的语句
使用 mysqlbinlog 的方法恢复数据的速度 还是不够快 ，主要原因
- 如果 误删表 ，最好是 只重放这张表的操作 ，但 mysqlbinlog 并不能指定只解析一个表的日志
- 用 mysqlbinlog 解析出日志来应用，应用日志的过程只能是 单线程 的
另外一个加速的方法： Master-Slave

Master-Slave

MySQL -- 数据恢复

在 START SLAVE 之前，先通过执行 CHANGE REPLICATION FILTER REPLICATE_DO_TABLE=(tbl_name)
- 让临时库 只同步误操作的表 ，利用 并行复制 技术，来加速整个数据恢复过程
binlog 备份到线上备库之间是一条虚线
- 虚线指的是如果由于时间太久，线上备库有可能已经删除了临时实例所需要的 binlog
  - 可以从 binlog 备份系统中找到需要的 binlog ，再放到备库中
- 举例说明
  - 例如当前临时实例需要的 binlog 是从 master.000005 开始
  - 但在线上备库上执行 SHOW BINARY LOGS 显示最小的 binlog 文件是 master.000007
  - 意味着少了两个 binlog 文件
  - 这时需要到 binlog 备份系统找到这两个文件，把之前删掉的 binlog 放回备库执行以下步骤
  - 从备份系统下载 master.000005 和 master.000006 ，放到备库的日志目录下
  - 打开 master.index ，在文件头加入两行： ./master.000005 和 ./master.000006
  - 重启备库，目的是为了让备库 重新识别 这两个日志文件
  - 现在备库上就有了临时实例所需要的所有 binlog ，建立主备关系，就可以正常同步了

延迟复制备库

上面 Master-Slave 的方案利用了 并行复制 来加速数据恢复的过程，但 恢复时间不可控
- 如果一个库特别大，或者误操作的时间距离上一个全量备份的时间较长（一周一备）
针对核心业务， 不允许太长的恢复时间 ，可以搭建 延迟复制的备库 （MySQL 5.6引入）
延迟复制的备库是一种特殊的备库
```
CHANGE MASTER TO MASTER_DELAY=N
STOP SLAVE
```

参考资料

《MySQL实战45讲》

转载请注明出处：http://zhongmingmao.me/2019/03/04/mysql-data-recovery/

访问原文「MySQL -- 数据恢复」获取最佳阅读体验并参与讨论

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

精通Web Analytics 2.0

[美]Avinash Kaushik / 郑海平、邓天卓 / 清华大学出版社 / 2011-4-26 / 48.00元

向数据驱动型决策转变以及如何利用网站数据来获得竞争优势在过去几年中，互联网、在线营销以及广告经历了巨大的变革，然而大家处理数据的方式跟几十年前相比还是大同小异，停滞不前。网站分析领域的领跑者Analytics kaushik通过《精通Web Analytics 2.0——用户中心科学与在线统计艺术》提出了下一代网站分析的框架，将能很大程度地帮助你提高组织的能动性和对市场的反应速度。 ......一起来看看《精通Web Analytics 2.0》这本书的介绍吧!

码农工具

JSON 在线解析

在线 JSON 格式化工具

RGB HSV 转换

RGB HSV 互转工具