首页
学习
活动
专区
圈层
工具
发布

记录一次MySQL大表拆分和迁移

背景# 最近遇到一个关于MySQL单表过大的问题,该表存放的主要是日志文件,且其中有一个字段存放的数据过大,导致占用空间过大以及查询效率的降低,这种设计其实是不合理的。...目前该表占用1.2T容量,数据量超过3亿条,而这个RDS数据库的容量总共就2T,且由于种种原因无法扩容,迫不得已急需给出解决方案。 2....解决方案# 根据上面的背景,可得出以下这些问题,也给出了解决方案: 问题 解决方法 1 某字段占用空间较大,在MySQL中为text类型,存储的是json格式的数据,该字段平均占用空间为5KB 对字段进行压缩...,把json格式压缩成字节序列,压缩后可节省5倍空间左右 2 单表数据量过大,而我们的业务是基本只取本年的数据,该表中很多不使用的数据导致查询效率降低 对该表按年份分表,本年的数据为热数据,之前的数据为冷数据...log_table,这种方式不仅命中了索引,还避免了全表扫描 2.2.2 步骤二压缩# 上面查出了1万条数据,接着要做的就是批量压缩,如果采用for循环1个1个的压缩,那么效率必然不是最高的,可以利用go

1.8K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    大表分表策略:垂直拆分与水平拆分的应用

    引言 随着业务数据量激增,单表性能瓶颈日益凸显。当MySQL单表数据量突破千万级时,查询延迟、写入阻塞等问题频发。此时分表策略成为关键解决方案。...一、垂直拆分:按业务维度解耦 核心思想 将单表按列拆分为多个子表,遵循字段相关性原则: -- 原始用户表 CREATE TABLE user( id INT PRIMARY KEY, name...当数据量持续增长导致单表行数过大时,需要更激进的解决方案——水平拆分。...二、水平拆分:数据量的分布式突围 核心思想 当垂直拆分后单表数据仍持续增长(如亿级用户表),水平拆分通过行维度切分将数据分布到多个物理表。...决策树: 是否单表宽度过大? → 是 → 垂直拆分 ↓否 是否写入/查询压力大? → 是 → 水平拆分 ↓否 是否字段访问模式差异大?

    37421

    MySQL大表设计

    数据库设计表结构设计垂直分割:将大的表分割成多个相关性较小的表,以减少单个表的字段数量。这有助于提高查询效率和降低冗余。规范化:合理使用规范化,将重复数据抽取成独立的表,以减小数据冗余。...TABLE main_data ( id INT PRIMARY KEY, field_1 VARCHAR(255), field_2 INT, -- 其他字段);-- 例子:关联表CREATE...分库分表如果数据量仍然巨大,可以考虑分库分表策略,将数据划分到不同的数据库或表中。4. 数据分区根据时间、范围等条件对数据进行分区,以提高查询效率。5....垂直分割对于一些很少使用的字段,可以考虑将其垂直分割到其他表中,只在需要时进行关联查询。6. 数据库参数调优调整数据库的参数,如缓冲池大小、连接池大小等,以适应大规模数据的存储和查询需求。

    74110

    Mysql大表优化方案

    当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化: 单表优化 除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度,一般以整型值为主的表在千万级以下...表分区 MySQL在5.1版引入的分区是一种简单的水平拆分,用户需要在建表的时候加上分区参数,对应用是透明的无需修改代码 对用户来说,分区表是一个独立的逻辑表,但是底层由多个物理子表组成,实现分区的代码实际上是通过对一组底层表的对象封装...垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联 比如原始的用户表是: ?...) 事务处理复杂 水平拆分 概述 水平拆分是通过某种策略将数据分片来存储,分库内分表和分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量。...IO、CPU、网络,这个就要通过分库来解决 前面垂直拆分的用户表如果进行水平拆分,结果是: ?

    3.2K71

    MySQL 大表优化方案

    当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化: 单表优化 除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度,一般以整型值为主的表在千万级以下...表分区 MySQL在5.1版引入的分区是一种简单的水平拆分,用户需要在建表的时候加上分区参数,对应用是透明的无需修改代码 对用户来说,分区表是一个独立的逻辑表,但是底层由多个物理子表组成,实现分区的代码实际上是通过对一组底层表的对象封装...垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联 比如原始的用户表是: ?...(需要水平拆分) 事务处理复杂 水平拆分 概述 水平拆分是通过某种策略将数据分片来存储,分库内分表和分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量...IO、CPU、网络,这个就要通过分库来解决 前面垂直拆分的用户表如果进行水平拆分,结果是: ?

    1.8K10

    MySQL大表优化方案

    当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化:   单表优化   除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度,...表分区   MySQL在5.1版引入的分区是一种简单的水平拆分,用户需要在建表的时候加上分区参数,对应用是透明的无需修改代码   对用户来说,分区表是一个独立的逻辑表,但是底层由多个物理子表组成,实现分区的代码实际上是通过对一组底层表的对象封装...MySQL有一种早期的简单的分区实现 - 合并表(merge table),限制较多且缺乏优化,不建议使用,应该用新的分区机制来替代   垂直拆分   垂直分库是根据数据库里面的数据表的相关性进行拆分,...垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联   比如原始的用户表是: ?...(需要水平拆分) 事务处理复杂   水平拆分   概述   水平拆分是通过某种策略将数据分片来存储,分库内分表和分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量

    3.4K61

    MySQL大表优化方案

    1、尽量不要在一开始就考虑表拆分,会带来逻辑、部署、运维的各种复杂度; 2、一般以整型值为主的表在千万级以下,字符串为主的表在五百万以下问题不大; 注意: 1、Covering index:...索引覆盖:即当索引本身包含查询所需全部数据时,不再访问数据文件本身,也就是不再需要回表操作; 2、复合索引顺序:理论上索引对顺序是敏感的,但是由于MySQL的查询优化器会自动调整where子句的条件顺序以使用适合的索引...很难查询优化且占用额外索引空间; 用整型来存IP; 2、索引 索引不是越多越好,要根据查询有针对性的创建,考虑在WHERE和ORDER BY涉及到的列建索引,可以根据EXPLAIN来查看是否用了索引还是全表扫描...; 避免在WHERE子句中对字段进行NULL值判断,否则将导致全表扫描; 值分布稀少的字段不适合建立索引,如“性别”的这种; 字符字段只建立前缀索引【注意:不能用于ORDER BY和GROUP BY操作...; SQL语句尽可能简单: -- a、一条SQL只能在一个CPU运算; -- b、大语句拆小语句,减少锁时间; -- c、一条大SQL可以堵死整个库; 不用 SELECT * ; OR 改写成 IN

    1.4K20

    MySQL 大表优化方案

    单表优化 除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度,一般以整型值为主的表在 千万级以下,字符串为主的表在 五百万以下是没有太大问题的。...,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边 sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库 不用 SELECT...表分区 MySQL在5.1版引入的分区是一种简单的水平拆分,用户需要在建表的时候加上分区参数,对应用是透明的无需修改代码 对用户来说,分区表是一个独立的逻辑表,但是底层由多个物理子表组成,实现分区的代码实际上是通过对一组底层表的对象封装...垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联 比如原始的用户表是: 垂直拆分后是...) 事务处理复杂 水平拆分 概述 水平拆分是通过某种策略将数据分片来存储,分库内分表和分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量。

    2K40

    MySQL 大表优化方案

    当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化: 单表优化 除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度,一般以整型值为主的表在千万级以下...表分区 MySQL在5.1版引入的分区是一种简单的水平拆分,用户需要在建表的时候加上分区参数,对应用是透明的无需修改代码 对用户来说,分区表是一个独立的逻辑表,但是底层由多个物理子表组成,实现分区的代码实际上是通过对一组底层表的对象封装...垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联 比如原始的用户表是: ?...(需要水平拆分) 事务处理复杂 水平拆分 概述 水平拆分是通过某种策略将数据分片来存储,分库内分表和分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量...IO、CPU、网络,这个就要通过分库来解决 前面垂直拆分的用户表如果进行水平拆分,结果是: ?

    1.7K40

    MySQL大表优化方案

    背景 阿里云RDS FOR MySQL(MySQL5.7版本)数据库业务表每月新增数据量超过千万,随着数据量持续增加,我们业务出现大表慢查询,在业务高峰期主业务表的慢查询需要几十秒严重影响业务 方案概述...TINYINT类型代替枚举ENUM 存储精确浮点数必须使用DECIMAL替代FLOAT和DOUBLE 字段长度严重根据业务需求来,不要设置过大 尽量不要使用TEXT类型,如必须使用建议将不常用的大字段拆分到其它表...MySQL对索引字段长度是有限制的, innodb引擎的每个索引列长度默认限制为767字节(bytes),所有组成索引列的长度和不能大于3072字节(mysql8.0单索引可以创建1024字符) 大表有...并行查询适用于大部分SELECT语句,例如大表查询、多表连接查询、计算量较大的查询。对于非常短的查询,效果不太显著。...五、交互式分析Hologre 大表慢查询我们虽然用并行查询优化提升了效率,但是一些特定的需求实时报表、实时大屏我们还是无法实现,只能依赖大数据去处理。

    2K11

    数据库表的垂直拆分和水平拆分

    表的垂直拆分和水平拆分 垂直拆分 垂直拆分是指数据表列的拆分,把一张列比较多的表拆分为多张表 20191028234705.png 通常我们按以下原则进行垂直拆分: 把不常用的字段单独放在一张表...; 把text,blob等大字段拆分出来放在附表中; 经常组合查询的列放在一张表中; 垂直拆分更多时候就应该在数据表设计之初就执行的步骤,然后查询的时候用join关键起来即可; 水平拆分 水平拆分是指数据表行的拆分...拆分原则 通常情况下,我们使用取模的方式来进行表的拆分;比如一张有 400w 的用户表users,为提高其查询效率我们把其分成4张表users1,users2,users3,users4 通过用 ID...into uid_temp values(null); 得到自增的 ID 后,又通过取模法进行分表插入; 注意,进行水平拆分后的表,字段的列和类型和原表应该是相同的,但是要记得去掉 auto_increment...——摘自《表的垂直拆分和水平拆分》

    2.9K10

    MySQL 大表优化方案(长文)

    ,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度,一般以整型值为主的表在千万级以下,字符串为主的表在五百万以下是没有太大问题的。...,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边 3、sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库 4、不用SELECT...表分区 MySQL在5.1版引入的分区是一种简单的水平拆分,用户需要在建表的时候加上分区参数,对应用是透明的无需修改代码 对用户来说,分区表是一个独立的逻辑表,但是底层由多个物理子表组成,实现分区的代码实际上是通过对一组底层表的对象封装...垂直分表是对数据表进行垂直拆分的一种方式,常见的是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联,比如原始的用户表是: 垂直拆分后是...(需要水平拆分) 事务处理复杂 水平拆分 概述 水平拆分是通过某种策略将数据分片来存储,分库内分表和分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量。

    1.7K50
    领券