开发者社区 > 博文 > mysql磁盘碎片整理
分享
  • 打开微信扫码分享

  • 点击前往QQ分享

  • 点击前往微博分享

  • 点击复制链接

mysql磁盘碎片整理

  • jd****
  • 2024-08-26
  • IP归属:北京
  • 33浏览

    背景

    数据结转过程中经常进行 delete 操作,产生空白空间,如果进行新的插入操作,MySQL将尝试利用这些留空的区域,但仍然无法将其彻底占用,于是造成了数据的存储位置不连续,以及物理存储顺序与理论上的排序顺序不同,久而久之就产生了碎片。

    碎片治理思路

    根据线上处理经验总结比对4种处理磁盘碎片优缺点


    治理方案
    优势
    缺点
    备注
    将数据量巨大的表设计成分区表,按时间分区
    通过结转分区数据,删除分区释放磁盘碎片,磁盘IO抖动秒级别,对线上业务影响小
    估算数据量,每个分区不超过3亿数据350G为佳;库存流水,订单表这些表应该在创建时就应该设计成分区表,避免以后磁盘碎片痛点
    重建表存储引擎,重新组织数据(ALTER TABLE tablename ENGINE=InnoDB;)
    整理过程加锁,周期长,且对线上业务影响较大:10亿数据量,1000G,tp99会持续超过60s
    谨慎操作
    主从切换(DBA可使用一个磁盘更大的干净的库,进行主从切换)
    涉及面广,牵扯范围较大,处理时长在分钟级
    谨慎操作
    创建临时表进行数据双写最后进行数据库表名切换
    零延迟,无抖动,对线上无任何影响
    需要磁盘空间较大


    创建分区表

    上述分区表,在某一分区内数据结转完成后,

    ALTER TABLE warehouse_stock_flow drop PARTITION p24;
    

    当然不是所有的表都是可以创建分区表的。如果某一张数据表在很长一段时间内没有进行数据结转,且无法创建分区表的话,可以利用以下方法。


    表名切换

    如果某一张数据表在很长一段时间内没有进行数据结转,可以创建临时表,通过大数据将某一结转周期内数据推送至临时表,在代码层面进行数据的双写,最后再通过表名更换的方式进行表名转换。其实,治理磁盘碎片最好的方法就是删除表,不同业务对数据的要求不同。如果有可能的话新建一个临时表。

    利用rename语句对数据库表信息进行修改,不会锁表,可以达到零延迟,无抖动,对线上无任何影响。

    rename table xx_record to xx_record_temp1,xx_temp to xx_record,xx_record_temp1 to xx_record_temp;
    

    总结

    不管是使用云还是商城数据库,只要使用mysql,必然会遇到Mysql碎片问题痛点,数据量大的业务表应该设计成分区表方便磁盘碎片整理,降低维护成本和业务影响。碎片清理前后,IO性能会上升,SQL执行效率更快。所以,在日常运维工作中,应对碎片进行定期清理,保证数据库有稳定的性能和充足的空间。

    扩展

    提到提高IO性能,在紧急情况下还可以考虑开启刷盘(设置 sync_binlog=0;innodb_flush_log_at_trx_commit=0),但开启刷盘会有数据丢失风险(集团数据库模板配置参数默认sync_binlog=1;innodb_flush_log_at_trx_commit=1)。

    附件

    mysql数据库核心参数介绍:https://www.cnblogs.com/klvchen/p/10861850.html







    文章数
    2
    阅读量
    573