首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

记录一次MySQL拆分和迁移

背景# 最近遇到一个关于MySQL过大的问题,该存放的主要是日志文件,且其中有一个字段存放的数据过大,导致占用空间过大以及查询效率的降低,这种设计其实是不合理的。...目前该占用1.2T容量,数据量超过3亿条,而这个RDS数据库的容量总共就2T,且由于种种原因无法扩容,迫不得已急需给出解决方案。 2....解决方案# 根据上面的背景,可得出以下这些问题,也给出了解决方案: 问题 解决方法 1 某字段占用空间较大,在MySQL中为text类型,存储的是json格式的数据,该字段平均占用空间为5KB 对字段进行压缩...,把json格式压缩成字节序列,压缩后可节省5倍空间左右 2 单数据量过大,而我们的业务是基本只取本年的数据,该中很多不使用的数据导致查询效率降低 对该按年份分,本年的数据为热数据,之前的数据为冷数据...更新具体步骤# 上面的代码是对单条数据的压缩,现在需要从数据库查出数据,然后批量的压缩,采用更新的操作,需要考虑如下问题: ① 每一批取出多少条数据 ② 批量压缩采用goroutine并发压缩 ③ 批量更新如何操作

1.4K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    数据库的垂直拆分和水平拆分

    的垂直拆分和水平拆分 垂直拆分 垂直拆分是指数据表列的拆分,把一张列比较多的拆分为多张 20191028234705.png 通常我们按以下原则进行垂直拆分: 把不常用的字段单独放在一张...; 把text,blob等大字段拆分出来放在附表中; 经常组合查询的列放在一张中; 垂直拆分更多时候就应该在数据设计之初就执行的步骤,然后查询的时候用join关键起来即可; 水平拆分 水平拆分是指数据行的拆分...拆分原则 通常情况下,我们使用取模的方式来进行拆分;比如一张有 400w 的用户users,为提高其查询效率我们把其分成4张users1,users2,users3,users4 通过用 ID...into uid_temp values(null); 得到自增的 ID 后,又通过取模法进行分插入; 注意,进行水平拆分后的,字段的列和类型和原应该是相同的,但是要记得去掉 auto_increment...——摘自《的垂直拆分和水平拆分

    2K10

    数据库MySQL-数据库的水平拆分

    4、数据库的水平拆分 1、为什么水平拆分 的水平拆分是为了解决单数据量过大的问题,水平拆分每一个的结构都是完全一致的,以下面的peyment为例来说明 desc payment; ?...如果单的数据量达到上亿条,那么这时候我们尽管加了完美的索引,查询效率低,写入的效率也相应的降低。...3、如何将数据平均分为N份 通常水平拆分的方法为: 1、对customer_id进行hash运算,如果要拆分为5个则使用mod(customer_id,5)取出0-4个值。...2、针对不动的hashid把数据存储到不同的中。 4、水平拆分面临的挑战 1、夸分区进行数据查询 前端业务统计:业务上给不同的用户返回不同的业务信息,对分区没有大的挑战。...2、统计及后台报表操作 但是对后台进行报表统计时,数据量比较大,后台统计时效性比较低,后台就用汇总表,将前后台的拆分开。

    2.1K20

    MYSQL数据库数据拆分之分库分总结

    如果使用mysql, 还有一个更严重的问题是,当需要添加一列的时候,mysql会锁,期间所有的读写操作只能等待。...Mysql数据库分库分规则 设计的时候需要确定此按照什么样的规则进行分库分。...MySQL使用为什么要分库分? 可以用说用到MySQL的地方,只要数据量一大, 马上就会遇到一个问题,要分库分. 这里引用一个问题为什么要分库分呢?MySQL处理不了大的吗?...因为面临文件系统如Ext3文件系统对大于大文件处理上也有许多问题.这个层面可以用xfs文件系统进行替换.但MySQL太大后有一个问题是不好解决: 结构调整相关的操作基本不在可能.所以大项在使用中都会面监着分库分的应用...从Innodb本身来讲数据文件的Btree上只有两个锁, 叶子节点锁和子节点锁,可以想而知道,当发生页拆分或是添加新叶时都会造成表里不能写入数据.所以分库分还就是一个比较好的选择了.

    1.9K50

    使用Python拆分Excel工作

    相关链接>>>Excel与VBA,还有相关的Python,到这里来问我 其中有一个问题是: 如何用Python按照某列的关键词分拆工作,并保留中原有的公式。...图1 这里,假设这个工作所在工作簿的名字是“拆分示例.xlsx”,并且根据列C中的分类来拆分工作,有两个分类:建设项目和电商,因此应该拆分成两个工作。此外,列F是计算列,其中包含有公式。...] == '电商'] df1.to_excel(r'D:\建设项目.xlsx',index= False) df2.to_excel(r'D:\电商.xlsx',index = False) 将该工作按分类拆分成了两个工作...拆分到同一工作簿中的两个工作 代码如下: import pandas as pd df = pd.read_excel(r'D:\拆分示例.xlsx') df1 = df.loc[df['分类'] =...= df.loc[df['分类'] ==subcat] myfile.to_excel('D:\\'+subcat+'.xlsx',index = False) 遗憾的是,我现在还不知道怎么在拆分后的工作中保留原公式

    3.5K30

    ②⑩① 【MySQL】什么是分库分拆分策略有什么?什么是MyCat?

    拆分策略 分库分拆分方式: 垂直拆分 垂直分库 垂直分 水平拆分 水平分库 水平分 ⚪ 垂直拆分 垂直分库: 以为依据,根据业务将不同拆分到不同库中去。...特点: ①每个库的结构都不一样。 ②每个库的数据不一样。 ③所有库的并集是全量数据。 垂直分: 以字段为依据,根据字段属性将不同字段拆分到不同中。 特点: ①每个的结构都不一样。...②每个的数据也不一样,一般通过一列(主键/外键)关联。 ③所有的并集是全量数据。 ⚪ 水平拆分 水平分库: 以字段为依据,按照一定策略,将一个库的数据拆分到多个库中。...特点: ①每个库的结构都一样。 ②每个库的数据都不一样。 ③所有库的并集是全量数据。 水平分: 以字段为依据,按照一定策略,将一个中的数据拆分到多个中去。 特点: ①每个结构都一样。...它支持MySQL和MariaDB,并提供了水平分片、垂直分片、分布式事务等功能。

    29410

    如何理解数据库优化中的读写分离、垂直拆分、水平拆分、分库分

    读写分离意味着将一体的结构的进行分散,在数据量大、高并发的情景中要考虑以下这些问题 如何保证 Master 的高可用,故障转移,熔断限流等。...读写操作的区分规则,代码层面如何处理好读命令和写命令,尽量无感知无业务入侵。 数据一致性的容忍度。虽然是数据同步,但是由于网络的不确定性这仍然是一个不可忽视的问题。 3....分也分为 数据垂直拆分 和 数据水平拆分 。 4.1 数据垂直拆分 数据垂直拆分就是纵向地把中的列分成多个,把从“宽”变“窄”。...一般遵循以下几个点进行拆分: 冷热分离,把常用的列放在一个,不常用的放在一个。 大字段列独立存放 关联关系的列紧密的放在一起 我们把用户中常用的和不常用的而且大字段分离成两张: ?...4.2 数据的水平拆分 的水平拆分感觉跟库的水平拆分思想上都是一样的,只不过粒度不同。结构维持不变。也就是说拆分后数据集的并集等于拆分前的数据集。

    2.2K10

    mysql解锁_mysql如何解锁

    什么是MySQL? 为了给高并发情况下的mysql进行更好的优化,有必要了解一下mysql查询更新时的锁机制。 MySQL有三种锁的级别:页级、级、行级。...MyISAM和MEMORY存储引擎采用的是级锁(table-level locking);BDB存储引擎采用的是页面锁(page-level locking),但也支持级锁;InnoDB存储引擎既支持行级锁...MySQL这3种锁的特性可大致归纳如下: 级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。...页面锁:开销和加锁时间界于锁和行锁之间;会出现死锁;锁定粒度界于锁和行锁之间,并发度一般。 锁怎么解决?MySQL怎么解锁?...1、查进程,主要是查找被锁的那个进程的ID SHOW PROCESSLIST; 2、kill掉锁的进程ID KILL 10866;//后面的数字即时进程的ID 发布者:全栈程序员栈长,转载请注明出处

    3K40

    亿级大如何修改结构【MySQL

    二、深入讨论 那我们大如何修改结构呢?网络搜索了一圈,基本都围绕了两种方法进行:第一种是在用户访问量少的时间段,进行结构修改。第二种是采用copy替换原的方法。...大虽然修改结构会产生很多问题,但是大本身是可以做优化的,最明显的优化就是去除不必要的索引或者将多个单个索引合并成一个索引,减少大索引数据量大小,进而减少修改索引的时间。...简单的来说,就是新建一张,然后将你需要修改的结构先添加上去,因为是空,所以可以瞬间完成修改。后面再通过数据同步工具,将原的数据导入到新中。...当数据导入差不多的时候,将原修改为原_copy,新修改为原的名称,这一步也叫做表切换。...4.3 切换数据丢失问题 切换名这一步,数据库层面做不了限制,首先MYSQL不支持在锁住的情况下,再去修改名。

    4.8K10

    EF基础知识小记七(拆分实体到多个以及拆分到多个实体)

    一、拆分实体到多个 1、在日常开发中,会经常碰到一些老系统,当客户提出一些新的需求,这些需求需要在原来的的基础上加一些字段,大多数人会选择通过给原添加字段的方式来完成这些需求,方法,虽然可行,但是如果架构不合理的系统...,就会牵一发而动全身.所以处理这种需求比较合理的方式是:建一张新来存放新的字段....通过叫做合并两张及以上的到一个单独的实体,也叫分拆一个实体到多个,我们把每个组成部分当成一个逻辑实体.这个过程叫做逻辑分拆....二、拆分一张到多个实体 假设数据库中有一张,里面包含一些常用的字段,但是也包含一些不常用的大字段。...为了提供系统的性能,需要避免每个查询都去加载这些字段.这个时候我们就需要将拆分成两个或者更多的实体.

    1.3K60

    分库分拆分键设计

    拆分键的设计是这一过程中的关键决策,它影响数据的分布、查询效率以及系统的维护成本。本文将探讨如何根据业务需求和数据访问模式选择合适的拆分键,以实现数据库架构的优化,保证系统的高性能和高可用性。...如一个简单的电商数据库,在业务初期,为了快速验证业务模式,把用户、商品、订单都放到一个数据库中,随着业务的发展及用户量的增长,单数据库逐渐不能支撑业务(MySQL中单记录容量超过1K时,单数据量建议不超过一千万条...垂直拆分:简单的说就是将数据库及由一个拆分为多个,如我们这里的电商数据库,可以垂直拆分为用户数据库、商品数据库和订单数据库,订单可以垂直拆分为订单基本信息,订单收货地址、订单商品等,每一个表里保存了一个订单的一部分数据...分库分的关键项之一是拆分键的选取,一般情况下,拆分键的选取遵循以什么维度进行查询就选取该维度为拆分键。如:订单就以订单号作为拆分键,商品就以商品编号作为拆分键。...1、 数据库自增主键 在并发量不大的情况下,我们可以使用MySQL数据库里的自增主键来实现拆分键。

    19310

    mysql水平拆分与垂直拆分的详细介绍 原

    垂直拆分 垂直拆分是指数据表列的拆分,把一张列比较多的拆分为多张 通常我们按以下原则进行垂直拆分: 把不常用的字段单独放在一张; 把text,blob等大字段拆分出来放在附表中; 经常组合查询的列放在一张中...; 垂直拆分更多时候就应该在数据设计之初就执行的步骤,然后查询的时候用jion关键起来即可; 水平拆分 水平拆分是指数据行的拆分的行数超过200万行时,就会变慢,这时可以把一张的的数据拆成多张来存放...我们把其分成4张users1,users2,users3,users4 通过用ID取模的方法把数据分散到四张内Id%4+1 = [1,2,3,4] 然后查询,更新,删除也是通过取模的方法来查询...来提供自增的ID,该的唯一用处就是提供自增的ID; insert into uid_temp values(null); 得到自增的ID后,又通过取模法进行分插入; 注意,进行水平拆分后的,字段的列和类型和原应该是相同的...,但是要记得去掉auto_increment自增长 另外 部分业务逻辑也可以通过地区,年份等字段来进行归档拆分; 进行拆分后的,只能满足部分查询的高效查询需求,这时我们就要在产品策划上,从界面上约束用户查询行为

    2K30

    MySQL在Square的拆分实践

    现在所有的交易相关信息存储在MySQL中。这种电商类的网站,整体规模及也有一些值得学习的地方。 下面一起看看Square在MySQL方面的经验。...目前Square使用MySQL的规模如下: 超过4000个实例,基于Percona Server 5.6 使用GTID+Row格式复制 超过800台物理机器 数据总量在1PB左右 300多个服务构成 全年达...因为Square有MySQL主从结构更多的是在多IDC之间部署,考虑到机房之间IDC的可用性问题,并没有把业务过度的依赖的其它从库,而且把所有的业务尽量压在了主节点上。...Square在使用MySQL方面的建议: 1. 考虑到所有节点都有可能会失败 2. 每个进程都要考虑到管理 3. MySQL的Replcaiton是一个不错的架构 4....把MySQL当成队例或是Cache来用 9. HA环境,生产中要进行定期测试 10. 从应用层考虑拆分 11. 限制每个应用拆分的DB大小在1TB以内 12. 保持较小的集群, 拒绝大实例 13.

    1.2K30
    领券