mysql磁盘碎片整理-京东云开发者社区

背景

数据结转过程中经常进行 delete 操作，产生空白空间，如果进行新的插入操作，MySQL将尝试利用这些留空的区域，但仍然无法将其彻底占用，于是造成了数据的存储位置不连续,以及物理存储顺序与理论上的排序顺序不同，久而久之就产生了碎片。

碎片治理思路

根据线上处理经验总结比对4种处理磁盘碎片优缺点

治理方案	优势	缺点	备注
将数据量巨大的表设计成分区表，按时间分区	通过结转分区数据，删除分区释放磁盘碎片，磁盘IO抖动秒级别，对线上业务影响小		估算数据量，每个分区不超过3亿数据350G为佳；库存流水，订单表这些表应该在创建时就应该设计成分区表，避免以后磁盘碎片痛点
重建表存储引擎，重新组织数据（ALTER TABLE tablename ENGINE=InnoDB；）		整理过程加锁，周期长，且对线上业务影响较大：10亿数据量，1000G，tp99会持续超过60s	谨慎操作
主从切换（DBA可使用一个磁盘更大的干净的库，进行主从切换）		涉及面广，牵扯范围较大，处理时长在分钟级	谨慎操作
创建临时表进行数据双写最后进行数据库表名切换	零延迟，无抖动，对线上无任何影响	需要磁盘空间较大

创建分区表

上述分区表，在某一分区内数据结转完成后，

ALTER TABLE warehouse_stock_flow drop PARTITION p24;

当然不是所有的表都是可以创建分区表的。如果某一张数据表在很长一段时间内没有进行数据结转，且无法创建分区表的话，可以利用以下方法。

表名切换

如果某一张数据表在很长一段时间内没有进行数据结转，可以创建临时表，通过大数据将某一结转周期内数据推送至临时表，在代码层面进行数据的双写，最后再通过表名更换的方式进行表名转换。其实，治理磁盘碎片最好的方法就是删除表，不同业务对数据的要求不同。如果有可能的话新建一个临时表。

利用rename语句对数据库表信息进行修改，不会锁表，可以达到零延迟，无抖动，对线上无任何影响。

rename table xx_record to xx_record_temp1,xx_temp to xx_record,xx_record_temp1 to xx_record_temp;

总结

不管是使用云还是商城数据库，只要使用mysql，必然会遇到Mysql碎片问题痛点，数据量大的业务表应该设计成分区表方便磁盘碎片整理，降低维护成本和业务影响。碎片清理前后，IO性能会上升，SQL执行效率更快。所以，在日常运维工作中，应对碎片进行定期清理，保证数据库有稳定的性能和充足的空间。

扩展

提到提高IO性能，在紧急情况下还可以考虑开启刷盘（设置 sync_binlog=0;innodb_flush_log_at_trx_commit=0），但开启刷盘会有数据丢失风险（集团数据库模板配置参数默认sync_binlog=1;innodb_flush_log_at_trx_commit=1）。

附件

mysql数据库核心参数介绍：https://www.cnblogs.com/klvchen/p/10861850.html