最近线上有大表变更。所以给大家分享一下大表变更的工具。 MySQL大表变更主要有原生的online DDL、pt-osc(pt-online-schema-change)、ghost三种工具。
数据库设计表结构设计垂直分割:将大的表分割成多个相关性较小的表,以减少单个表的字段数量。这有助于提高查询效率和降低冗余。规范化:合理使用规范化,将重复数据抽取成独立的表,以减小数据冗余。...TABLE main_data ( id INT PRIMARY KEY, field_1 VARCHAR(255), field_2 INT, -- 其他字段);-- 例子:关联表CREATE...分库分表如果数据量仍然巨大,可以考虑分库分表策略,将数据划分到不同的数据库或表中。4. 数据分区根据时间、范围等条件对数据进行分区,以提高查询效率。5....垂直分割对于一些很少使用的字段,可以考虑将其垂直分割到其他表中,只在需要时进行关联查询。6. 数据库参数调优调整数据库的参数,如缓冲池大小、连接池大小等,以适应大规模数据的存储和查询需求。
Percona pt-archiver重构版--大表数据归档工具相信很多小伙伴们,在日常对接开发时,有很多大表在业务上并没有采取任何形式的切分,数据不停地往一张表里灌入,迟早有一天,磁盘空间报警。...作为一个DBA,侧重点是对数据库的操作性能(大表增加字段/索引,QPS等)和存储容量加以考虑,我们会建议开发对数据库里的大表进行数据归档处理,例如将3个月内的订单表保留在当前表,历史数据切分后保存在归档表中...一张大表,我们姑且说1亿条记录,原表我要保存近7天的数据。Percona pt-archiver工具是这样做的,逐条把历史数据insert到归档表,同时删除原表数据。...2、创建一个归档临时表和原表一样的空表结构。...注:考虑到删库跑路等安全性问题,工具没有对原表进行任何删除归档数据的操作。使用yum install php php-mysql -y######下面的配置信息修改成你自己的!!!
,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边 sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库 不用SELECT...根据命中率(Qcache_hits/(Qcache_hits+Qcache_inserts)*100))进行调整,一般不建议太大,256MB可能已经差不多了,大型的配置型静态数据可适当调大....垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联 比如原始的用户表是: ?...,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量。...,可以考虑一些云数据库: 腾讯云DCDB NoSQL 在MySQL上做Sharding是一种戴着镣铐的跳舞,事实上很多大表本身对MySQL这种RDBMS的需求并不大,并不要求ACID,可以考虑将这些表迁移到
当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化: 单表优化 除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度,一般以整型值为主的表在千万级以下...,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边 sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库 不用SELECT...垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联 比如原始的用户表是: ?...,分库内分表和分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量。...前面的表分区本质上也是一种特殊的库内分表 库内分表,仅仅是单纯的解决了单一表数据过大的问题,由于没有把表的数据分布到不同的机器上,因此对于减轻MySQL服务器的压力来说,并没有太大的作用,大家还是竞争同一个物理机上的
,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边 sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库 不用SELECT...根据命中率(Qcache_hits/(Qcache_hits+Qcache_inserts)*100))进行调整,一般不建议太大,256MB可能已经差不多了,大型的配置型静态数据可适当调大....垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联 比如原始的用户表是: ?...,分库内分表和分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量。...前面的表分区本质上也是一种特殊的库内分表 库内分表,仅仅是单纯的解决了单一表数据过大的问题,由于没有把表的数据分布到不同的机器上,因此对于减轻MySQL服务器的压力来说,并没有太大的作用,大家还是竞争同一个物理机上的
需求 有时候又删除大表的需求, 一般直接drop就行, 但有时候会有IO的问题. 什么叫大表呢?.../db1/sbtest1.ibd /data/mysql_3306/mysqldata/db1/sbtest1.ibd.rm 然后在mysql上删除sbtest1表 drop table sbtest1...-s -100MB /data/mysql_3306/mysqldata/db1/sbtest1.ibd.rm; sleep 1; done 方案2 导出表空间, 然后修改掉掉表空间数据文件的名字,...然后删除表 mysql> flush table sbtest2 for export; shell> mv /data/mysql_3306/mysqldata/db1/sbtest2.ibd /data...100MB. mysql的表也尽量不要整这么大, 日志表之类的, 可以按时间分个区.
1、尽量不要在一开始就考虑表拆分,会带来逻辑、部署、运维的各种复杂度; 2、一般以整型值为主的表在千万级以下,字符串为主的表在五百万以下问题不大; 注意: 1、Covering index:...索引覆盖:即当索引本身包含查询所需全部数据时,不再访问数据文件本身,也就是不再需要回表操作; 2、复合索引顺序:理论上索引对顺序是敏感的,但是由于MySQL的查询优化器会自动调整where子句的条件顺序以使用适合的索引...很难查询优化且占用额外索引空间; 用整型来存IP; 2、索引 索引不是越多越好,要根据查询有针对性的创建,考虑在WHERE和ORDER BY涉及到的列建索引,可以根据EXPLAIN来查看是否用了索引还是全表扫描...; 避免在WHERE子句中对字段进行NULL值判断,否则将导致全表扫描; 值分布稀少的字段不适合建立索引,如“性别”的这种; 字符字段只建立前缀索引【注意:不能用于ORDER BY和GROUP BY操作...; SQL语句尽可能简单: -- a、一条SQL只能在一个CPU运算; -- b、大语句拆小语句,减少锁时间; -- c、一条大SQL可以堵死整个库; 不用 SELECT * ; OR 改写成 IN
而事实上很多时候MySQL单表的性能依然有不少优化空间,甚至能正常支撑千万级以上的数据量。...,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边 sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库 不用 SELECT...垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联 比如原始的用户表是: 垂直拆分后是...,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量。...前面的表分区本质上也是一种特殊的库内分表 库内分表,仅仅是单纯的解决了单一表数据过大的问题,由于没有把表的数据分布到不同的机器上,因此对于减轻MySQL服务器的压力来说,并没有太大的作用,大家还是竞争同一个物理机上的
背景 阿里云RDS FOR MySQL(MySQL5.7版本)数据库业务表每月新增数据量超过千万,随着数据量持续增加,我们业务出现大表慢查询,在业务高峰期主业务表的慢查询需要几十秒严重影响业务 方案概述...MySQL对索引字段长度是有限制的, innodb引擎的每个索引列长度默认限制为767字节(bytes),所有组成索引列的长度和不能大于3072字节(mysql8.0单索引可以创建1024字符) 大表有...三、分表历史数据迁移到MySQL8.0 X-Engine存储引擎 分表业务表保留3个月数据(这个根据公司需求来),历史数据按月分表到历史库X-Engine存储引擎表, 为什么要选用X-Engine存储引擎表...并行查询适用于大部分SELECT语句,例如大表查询、多表连接查询、计算量较大的查询。对于非常短的查询,效果不太显著。...五、交互式分析Hologre 大表慢查询我们虽然用并行查询优化提升了效率,但是一些特定的需求实时报表、实时大屏我们还是无法实现,只能依赖大数据去处理。
下面就是一个MYSQL 针对一个数据库表归档的案例(这个案例也是有缺陷的,但目前是秉承着够用就好,以及时间成本的原则) 首先设计一个归档要考虑的问题如下 1 归档表的大小,以及每日最大,或最小的归档数据量...,主要是数据是不断灌入的,而数据的归档如果也是不断输出的,这样整体这个表的数据量就会有一个平衡,不会一下子少了很多,要不就是在清理的前一天,数据量已经大到一定的水平,有可能影响性能。...3 归档的方法,自己定义数据的归档方面,可以每次归档将数据灌入一个表,也可以定期的将数据写入不同的归档表,例如已归档日期和后缀的方式来将每次写入的数据进行分割,或者建立分区表的方式来进行归档。...以下以最简单的自动化的方案来讲 下图是基于案例来讲的 因为数据库是MYSQL 所以考虑了归档一次是多大的批量,避免归档数据量过大的时候将生产库hang 死,另外配置表主要的功能是有两个 1 限制一次拷贝和清理的数据量...配置表 ? 归档日志表 ?
3.帮助手册 bash bin/safe_delete -h 4.使用演示 查看表,删除手机号是“00175731528296189904”的数据,手机号不是索引字段 mysql(test@localhost
,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边 3、sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库 4、不用SELECT...根据命中率(Qcache_hits/(Qcache_hits+Qcache_inserts)*100))进行调整,一般不建议太大,256MB可能已经差不多了,大型的配置型静态数据可适当调大....垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联,比如原始的用户表是: 垂直拆分后是...分库内分表和分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量。...前面的表分区本质上也是一种特殊的库内分表 库内分表,仅仅是单纯的解决了单一表数据过大的问题,由于没有把表的数据分布到不同的机器上,因此对于减轻MySQL服务器的压力来说,并没有太大的作用,大家还是竞争同一个物理机上的
一.简介 源码地址 日期:2018/4/12 介绍:工具用于安全删除MySQL表,对于一些特定场景可能有用 应用场景:大批删除不走索引但是有主键的场景[可以是单列索引,也可是多列索引] 实现思路:根据where...中文 注意:必须有主键或者非空唯一索引 1.下载 git clone https://gitee.com/mo-shan/safe_delete.git cd safe_delete 2.配置,将这里的mysql_path...改成mysql工具的绝对路径,否则可能会因版本太低导致错误 ed -i 's#^mysql_path=....*#mysql_path=\"/mysqlbinlog_path\"#g' bin/safe_delete 将这里的safe_delete_path改成safe_delete的家目录的绝对路径 sed
删除表相关的磁盘文件 二、创建硬链接 三、删除表 四、删除文件释放空间 参考: ---- 在一个高负载的生产数据库上删除大表需要一些技巧,倘若直接drop table,将产生大量磁盘I/...1. buffer pool清除 删除表时,MySQL会将表在buffer pool中对应的页面清除,这个过程中会对buffer pool上一个全局排它锁。...通常可以使用以下三个步骤删除大表: 创建表文件的硬链接。 drop table删除表。 删除表文件释放磁盘空间。 二、创建硬链接 一个磁盘上的存储文件,可以由多个文件名引用。...例如,在没有硬链接时,t1表对应的磁盘文件如下: -rw-r----- 1 mysql mysql 17973 Jul 3 2018 t1.frm -rw-rw---- 1 mysql...可以使用以下脚本对一个数据库内的所有表创建硬链接: # MySQL数据目录 datadir=`mysql -uroot -p123456 -S /data/mysqldata/mysql.sock -e
前言 线上有一个表,大小为24G左右,没有什么重要的数据,却一直没有优化,导致业务无法进行,在此环境上,所以我们开始了删除之路 步骤 复制表 我这里使用Navicat工具直接复制表,选择仅结构即可。...ln instruction.frm instruction.frm.bak ln instruction.ibd instruction.ibd.bak 删除表 DROP TABLE "表格名";...24G的数据删除大概用了15秒左右 修改表名 将我们刚才复制的表,表名修改为线上正常使用的表名即可。...删除物理文件 切记大的物理文件不可直接删除,直接操作会导致磁盘IO和CPU利用率升高,影响线上业务可使用truncate来进行删除操作。
Mysql执行流程如下,首先mysql以tb_category作为驱动表,看到这,有没有感到很奇怪,tb_category在整个查询中只是作为一个子查询存在,tb_category怎么成为驱动表了呢?...原因是tb_category的表最小,只有300条数据,mysql查询优化器通常情况下都会以小表作为驱动表。...四张表的关联结果集有611万数据 如果读者了解Mysql关联查询原理的话,读者便会知道mysql的关联查询之后,如果再进行条件筛选是无法使用非驱动表索引的(换一句话讲,mysql关联查询只会使用驱动表的索引进行条件筛选...数据量少,mysql查询优化器会使用tb_category作为驱动表。...`article_id` 优化之后查询耗时18s,性能有了非常大的提升,我们再看一下优化后的explain结果 ?
二、深入讨论 那我们大表该如何修改表结构呢?网络搜索了一圈,基本都围绕了两种方法进行:第一种是在用户访问量少的时间段,进行表结构修改。第二种是采用copy替换原表的方法。...但是这种方式需要对业务规划非常清楚,而且也没办法100%解决大表修改字段问题,只能说缓解。...大表虽然修改表结构会产生很多问题,但是大表本身是可以做优化的,最明显的优化就是去除不必要的索引或者将多个单个索引合并成一个索引,减少大表索引数据量大小,进而减少修改表索引的时间。...四、copy替换原表 copy替换原表方式,虽然没有原表直接修改风险那么大,但是技术实现上面很复杂。我们先来介绍一下,什么叫做copy覆盖原表。...4.3 切换表数据丢失问题 切换表名这一步,数据库层面做不了限制,首先MYSQL不支持在锁住表的情况下,再去修改表名。
MySQL 大表数据添加新字段 有时候我们在测试环境给一个表添加字段,但是在线上环境添加一个字段,却极其的慢。...解决方案 扩展新表方案 创建一个新表user_ext(id,user_id,flag),将user表的id导入user_ext,然后user表和user_ext通过关联就可以间接实现我们的需求。...,导致新表数据流失不完整 总结 生产环境MySQL添加或修改字段主要通过如下四种方式进行,实际使用中还有很多注意事项 直接添加 如果该表读写不频繁,数据量较小(通常1G以内或百万以内),直接添加即可(可以了解一下...online ddl的知识) 使用pt_osc添加 如果表较大 但是读写不是太大,且想尽量不影响原表的读写,可以用percona tools进行添加,相当于新建一张添加了字段的新表,再将原表的数据复制到新表中...,切换后再将其他几个节点上添加字段 将现有MySQL版本5.7升级到8.0.12之后的版本 相关文章 Mysql事务 Mysql中的索引 Mysql通过binlog恢复数据
领取专属 10元无门槛券
手把手带您无忧上云