首页
学习
活动
专区
圈层
工具
发布

容灾系列(六)——数据存储容灾建设

数据存储容灾建设主要从数据可靠性和业务稳定性两个维度阐述。这两者有哪些区别呢?...后台数据复制机制能在任何一个副本出现故障时迅速通过数据迁移等方式复制一个新副本,时刻确保有三个副本可用,避免单点故障引起的数据丢失等问题,提高数据的可靠性。...一般网络抖动都是秒级的,建议重试次数通过退避指数方式来进行,以免造成短时间内机器负载突增。 同时针对使用COS分块上传或者重传,有一个优化技巧,首先COS分块上传以下三步: 1.初始化。...场景三:存储设备故障时间较长业务自愈能力建设 如果存储集群或者访问链路出现秒级的抖动,采用客户端或者应用重试方式是可行的。...这里最常用的就是新增COS和CBS盘的方式让业务进行临时写入,待故障恢复后,补齐数据。

4.2K73

客户容灾案例—zookeeper容灾迁移方案

3台不停止服务的最低限度是2台(X/2+1),而5台的最低限度是3台。 我们应该保证,集群中最低有3台ZooKeeper是启动的。...此外,重启时应保证先重启myid最小的机器,由小向大进行重启 Leader无论其myid大小,都放到最后重启 因为ZooKeeper的机制中,myid大的会向小的发起连接,而小的不会向大的发起连接。.../conf/zoo.cfgMode: follower 将其扩容为5节点的ZooKeeper 先查看原先的ZooKeeper集群情况 echo mntr|nc localhost 2181 这条4字命令可以查看集群的情况...STOPPED 查看新Leader ZooKeeper会尽可能的选择myid最大的机器为Leader,因此原本的idc02-kafka-ds-04其myid为5变为了Leader 12345 [hadoop...然后只要将现在的5台再缩小到3台且不包括原本myid为1-2的机器,就完成了迁移 将5台缩小回3台 修改idc02-kafka-ds-02 根据前面的注意事项,我们此时5台集群中启动的数量不得少于3台,

2.1K51
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    容灾的架构分析和容灾选择策略

    通常可通过共享存储或双机双柜的方式实现本地容灾,其中多以共享存储为主。 共享存储由三部分组成:活动主节点,不活动备节点,共享存储。...在数据级容灾方式下,所建立的异地灾备中心可以简单地把它理解成一个远程的数据备份中心。数据级容灾的恢复时间比较长,但是相比其他容灾级别来讲它的费用比较低,而且构建实施也相对简单。...应用级容灾生产中心和异地灾备中心之间的数据传输是采用异类的广域网传输方式;同时应用级容灾系统需要通过更多的软件来实现,可以使多种应用在灾难发生时可以进行快速切换,确保业务的连续性。...云容灾结合云平台的计算、存储和带宽等诸多优势,相比传统容灾具备了多方面的优势: 基础设施减少 摒弃采购传统的灾备服务器,借助云平台供应商提供的计算和存储平台,或直接采用云容灾DRaaS应用服务。...快速恢复 为即使有传统定制的远程备份,仍然需要时间去做数据的恢复和业务重启,且取决于远程备份的地点远近和远程服务器的性能。而云容灾是可以充分利用云的能力,突破物理限制,在云端做到业务启动。

    3.4K30

    什么是云容灾?与传统容灾灾备有何不同?

    这种方式的主要特点如下:高昂的基础设施成本:需要采购专门的服务器、存储设备、网络设备等,企业需要投入大量资金建设和维护。...相比之下,云容灾基于云计算技术,充分利用云平台的弹性和智能化能力,提供了一种更灵活、高效的灾备解决方案:对比项传统容灾云容灾基础设施自建或租用物理灾备中心依赖云服务,无需额外硬件成本投入高昂的硬件、机房...然而,该系统存在以下问题:维护成本高昂,灾备数据中心的服务器长期处于闲置状态。扩展能力不足,难以满足业务增长需求。灾备演练成本高,测试过程影响生产业务。...五、总结云容灾作为现代企业 IT 战略的重要组成部分,提供了更经济、高效和智能的灾备解决方案。...对于企业而言,合理规划云容灾方案,不仅是降低 IT 运营成本的有效手段,更是提升市场竞争力和业务稳定性的关键步骤。随着云计算技术的不断发展,云容灾将成为未来企业灾备体系的核心趋势。

    29510

    容灾系列(三)——云网络容灾建设

    IDC时代,业务对网络容灾参与较少,主要依赖数据中心网络容灾建设程度;当到了云的时代,云服务商将底层网络能力产品化后,云上客户更多参与网络容灾建设,提升业务稳定性。...以腾讯云为例,在同地域选择机房地址的时候,距离大于60公里,要求不同可用区延时小于3ms,来满足云上客户同城容灾建设基本需求。...2.网络容灾复杂度 同城或者异地容灾建设,网络层面因素主要有三个: 1)跨区或者跨地域网络延时,对上层业务影响。 网络延时,通过优化基础设施手段是非常有限的,毕竟受限于实际物理距离和光速。...混合云容灾模式,这里考虑到IDC和云上线路容灾情况,一般建议两条专线接入不同的POP点来进行容灾建设;同时建立VPN或者GRE公网逃生通道来紧急恢复业务。...注意:对于入口VIP写死情况,客户端升级的成本较高。 image.png 3.2 混合云网络容灾 混合云网络容灾分为两个部分: 1)idc和云机房之间线路容灾,主要线路分为专线和VPN。

    5.4K93

    同城容灾和异地容灾的区别,你知道多少?

    同城双活和异地双活在数据同步技术上的区别,主要源于距离带来的网络延迟,这直接影响了数据一致性、可用性和架构设计的复杂度。...同城双活的数据同步 同城双活数据中心通常在几十公里距离内,通过高质量、低延迟的专用网络线路(如光纤专线) 连接。这种低延迟网络允许采用同步或半同步的数据复制方式。...异步复制是主流方式,应用在本地中心写入数据后即可得到确认,数据随后异步地、批量地同步到异地中心。这牺牲了数据的实时一致性,但保证了写入性能和可用性。...共享存储或数据库主从模式 单元化架构(按用户/业务分片) 成本 专线成本较高,但存储配置可能更简单 异步复制带宽成本相对较低,但架构复杂度和改造成本高 主要优势 高可用、数据零丢失(RPO=0)、故障切换迅速 城市级容灾...2、容灾等级要求:同城双活可应对机房级故障。若需防范城市级灾难(如地震、大规模停电),则需异地双活。 3、成本预算:同城双活专线成本较高,但架构相对简单。

    14210

    容灾系列(九)——异地数据冷备容灾建设

    企业业务部署在云上,借助云平台的能力,企业几乎“零”成本拥有同地域数据备份的能力。...2.3 数据库备份服务数据库备份服务拥有一套完整的数据备份和数据恢复解决方案,具备实时增量备份以及快速的数据恢复能力,同时具备异地容灾能力。...采用数据库备份服务;当前数据库备份服务暂不支持redis,采用api方式进行备份;cos采用异地存储桶的复制进行数据备份。...3.2 业务恢复及回切如果云平台自愈能力超出预期,业务在北京地域进行资源1:1的部署恢复。对于数据恢复方式如下:cos数据恢复:cos存储桶异地复制,数据无需恢复。...4.本章小结方案实现方式rpo/rto资源费用业务改造数据备份业务恢复api方式实现小时计带宽和存储"零"改造人工实现数据和业务恢复均人工实现云函数与存储桶复制联动小时计带宽、存储和云函数费用"零"改造自动实现同上数据库备份服务小时计带宽

    10K164

    容灾系列(八)——同城数据冷备容灾建设

    为了让企业能更好用好云平台的数据安全能力,本文重点云平台数据备份冷备能力,以腾讯云为例,主要从以下两个维度介绍:同城数据冷备能解决企业什么问题,达到怎么样业务容灾效果?...同城冷备份方案同城数据冷备方案主要依赖于云平台能力备份能力,对现有业务架构没有任何改造,方案架构如下:图片该方案核心要点说明:数据备份:云侧数据库mysql和redis在控制台设置数据备份参数,数据备份存储在COS,具备地域级别容灾...mysql数据恢复主要有四种方式:在CVM自建mysql数据库,将备份数据导致恢复,目前控制台仅支持物理备份自动备份,如果使用逻辑备份恢复,需要用户定期调用api和控制台手动操作,恢复过程中要做一些适配兼容...本文小结同城冷备方案,在云平台的协助下,企业几乎0成本并拥有同城数据冷备能力来保障业务生命线。指标详细说明容灾能力具备同地域(不同可用区)数据备份能力,不具备不同地域的能力。...3.容灾演练能力建设,增加平时运维成本以及自动化工具开发功能。

    7.7K113

    灾备知识总结:容灾与备份区别、灾备技术、容灾体系规划

    容错(Fault Tolerance)解决范畴:单点硬件/软件故障实现方式:硬件冗余(如双机热备)+错误检查局限性:无法应对大规模灾难事件3....备份(Backup)本质定义:在线数据→离线存储的迁移过程核心价值恢复逻辑错误(误删/病毒)保存历史数据版本不可替代性:容灾系统无法修复人为错误4....灾难恢复(Disaster Recovery)阶段定位:灾难发生后的系统重建与容灾关系:现代容灾系统集成恢复功能二、容灾与备份的协同关系1. 功能互补性2....:微隔离技术增强容灾环境安全性结语构建企业级灾备体系需遵循"预防-响应-恢复"的完整闭环,中科热备作为国产化灾备技术领军者,通过持续创新在金融、医疗、政务等领域成功部署超过2000个案例。...建议企业根据业务特性选择"备份+容灾+恢复"的三维防护策略,定期开展灾备演练,真正实现业务连续性保障。

    31810

    灾备知识总结:容灾与备份区别、灾备技术、容灾体系规划

    容灾系统在企业中给与数据安全系数相当高的保障,但是容灾系统倒是是什么,他们是什么意思?恐怕连正在使用容灾备份的网络管理人员都不能解释。本文用最浅显的语言给大家解释容灾备份到底是什么。...容灾不能替换备份 容灾系统会完整地把生产系统的任何变化复制到容灾端去,包括不想让它复制的工作,比如不小心把计费系统内的用户信息表删除了,同时容灾端的 用户信息表也会被完整地删除。...如果是同步容灾,那容灾端同时就删除了;如果是异步容灾,那容灾端在数据异步复制的间隔内就会被删除。这时就需要从备份系统 中取出最新备份,来恢复被错误删除的信息。...常用的灾备组合方式 基于以上原因,业界在灾备系统的建设上一般按照以下几种方式: 建设机房内的本地备份系统 建设异地的备份系统 该方式可以备份系统的价格满足备份和异地容灾功能,能够避免主生产中心由于地震、...同步方式 ? 半同步方式 ? 异步方式 ? 1.2 智能交换机技术 ? 2.1 卷管理软件灾备技术 ? 2.2 数据库日志复制技术 ? 2.3 数据库灾备技术 ? 3.1 应用灾备技术 ?

    12.9K21

    数据中心容灾精讲(常见的容灾建设模式)

    当前,市场上常见的容灾模式可分为同城容灾、异地容灾、双活数据中心、两地三中心几种。...同城容灾 同城容灾是在同城或相近区域内(≤200KM)建立两个数据中心:一个为数据中心,负责日常生产运行;另一个为灾难备份中心,负责在灾难发生后的应用系统运行。...同城灾难备份一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。 异地容灾 异地容灾主备中心之间的距离较远(>200KM)因此一般采用异步镜像,会有少量的数据丢失。...由于同城灾难备份和异地灾难备份各有所长,为达到最理想的防灾效果,数据中心应考虑采用同城和异地各建立一个灾难备份中心的方式解决。...异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。

    2.9K20

    容灾系列(七)——混合云公网出口容灾建设

    本文结合云平台公网能力,从网络平台角度来分析容灾建设可行性。...通常专线接入选择不同的POP,多条专线实现互通和高可用。 云平台公网出口能力为EIP。入口流量通过CLB进行分发;出口流量通过NAT网关(即绑定EIP);服务器直接绑定EIP来访问公网。...整体公网出口容灾方案如下: image.png 2.1.1 云平台切换方案。 正常情况下,业务流量通过NAT访问公网,如上路绿色线条标识。...2.1.2 IDC容灾切换方案 正常情况下,IDC业务流量通过NAT访问公网,如上路绿色线条标识。...IDC公网出口容灾方案 (推荐) 1.方案简单,更多依赖云平台能力 2.方案落地快捷。 3.人力成本低,不需要自建系统。 4.维护成本低,不需要后续维护系统稳定性。

    3.7K124

    容灾系列(四)——业务应用层容灾建设

    综上所述,本文从云平台视角出发阐述应用层业务容灾建设,主要分为方案设计考虑纬度、复杂度以及云上客户案例三个方面。 1.应用容灾概述 1.1 应用部署 应用是否满足跨地域/可用区部署?...应用层调用链能接受跨区延时,一般以试点业务先观察,小步迭代方式逐步构建容灾能力。...1)业务完全能接受跨区延时,不同的可用区应用部署规模(1:1),各承载50%的业务流量; 2)业务并不能完全接受跨区延时,为了容灾做业务做了部分妥协,两个可用区业务部署的规模(5:1),主要业务承载在主可用区...容灾切换强依赖于调度系统以及配置系统稳定性。这里稳定性主要包括系统容灾能力和性能;遇到大规模故障,大量信息配置变更请求调度系统和配置系统要能扛住洪峰,是保障这个容灾方案的根基。...2.应用容灾复杂度 计算应用层容灾,主要考虑以下两个方面: 哪些节点执行任务。 这里要区分清楚哪些节点执行核心业务,这里会引入不同的复杂度。

    4K72

    服务的容灾与容错

    引子 先介绍几个概念,同步一下认知: 容灾:是指系统冗余部署,当一处由于意外停止工作,整个系统应用还可以正常工作。 容错:是指在运行中出现错误(如上下游故障或概率性失败)仍可正常提供服务。...其他没有故障的是可靠的。 稳定性:这个业界没有明确的定义,我的理解是:在受到各种干扰时仍然能够提供符合预期的服务的能力。 从要求的严格程度上:可用性容灾,而对稳定性同时包含容灾和容错。 服务的容灾 服务容灾的解决方案就是冗余。多几个备份来切换。常用的有N+1容灾和两地三中心。N和中心实际上都是机房的意思。...N是数据中心的电力配置部分。电力配置有市电和备用发动机供电,但是一般互联网公司是不支持备用发动机供电的。所以一般一个机房就是一个N。 N+1容灾就是要多出一个机房做容灾。...这个备份的冷备和热备不同于数据库的冷备和热备。数据库的冷备是离线备份,就是不接收新流量的情况下备份。热备是一边接收流量一边备份。 而通常服务的冷备是服务还没有接收流量。

    3.3K20

    前端接口容灾

    有没有不白屏的方案? 有啊,还挺简单的。 容我细细细细分析。 原因就是接口挂了,拿不到数据了。那把数据储存起来就可以解决问题。 思考 存哪里? 第一时间反应浏览器本地存储,想起了四兄弟。...选型对比 特性 cookie localStorage sessionStorage indexDB 数据生命周期 服务器或者客户端都可以设置、有过期时间 一直存在 关闭页面就清空 一直存在 数据储存大小...4KB 5MB 5MB 动态,很大大于250MB 与服务器通信 每次都带在header中 不带 不带 不带 兼容性 都支持 都支持 都支持 IE不支持,其他主流都支持 考虑到需要存储的数据量,5MB...带动态标识,譬如时间戳等可以手动过滤 /** * 生成接口唯一键值 */ generateCacheKey = (config) => { // 请求方式,参数,请求地址, const {...劣势包括使用局限,不适合对数据实效性比较高的业务场景,不支持 IE 浏览器。 接口容灾我们也是刚弄不久,有许多细节与不足,欢迎沟通交流。 接口容灾本意是预防发生接口服务挂了的场景,我们不会很被动。

    44510

    容灾知识知多少

    为什么要做容灾? 你知道吗?自然灾害、设备故障、人为因素等都会造成业务中断。如今数字化时代,IT系统故障更会对公司业务造成难以估量的巨大经济损失。...维斯康星州大学 2 监管要求 2011年,银监会发布《商业银行业务连续性监管指引》 2008年,保监会发布《保险业信息系统灾难恢复管理指引》 2008年,中国人民银行发布《银行业信息系统灾难恢复管理规范》 现在的公司有责任建立完善的容灾管理体系...3 容灾关键词 RPO(Recovery Point Objective) 数据恢复点目标,主要指的是业务系统最大能容忍的数据丢失量。...容灾体系介绍 1 数据中心 集团公司通过两地建立三个数据中心,通过双活、冷备等方式,实现两地三中心容灾架构。...容灾演习要求 每年进行容灾演练,所有核心业务与平台系统均要参演。 异地灾备恢复、同城双活切换、一键式自动化启停等恢复方式不断创新,要求演习规模逐年扩大和恢复效率逐年提升。 - End - ----

    1.6K20

    容灾系列(十)——数据热备容灾能力建设【基础篇】

    企业业务敏感程度差异,对容灾指标RPO&RTO要求也不同。之前两篇文章主要介绍数据冷备,主要特点是数据备份存储非实时,备份系统存储数据通常昨天的数据,当灾难真正来临的时候,今天新产生的数据会丢失情况。...异地明确数据热备容灾能力,实时明确RPO指标接近于“零”。尤其是实时,对于RPO指标提升,为此需要企业投入更多的成本。...2)灾备实例,建议采用云平台的PAAS服务,更好的兼容DTS同步服务。2.2 平台热备方案2.2.1 数据库灾备方案目前数据库对于异地容灾备份能力进行封装,来简化云上客户操作成本,提升RTO。...方案关键因素详细说明容灾范围地域级别容灾RPO/RTORPO几乎接近为零;RTO为小时级别,进行1:1业务部署,依赖于业务部署和数据恢复自动化能力。...3.容灾演练能力建设,增加平时运维成本以及自动化工具开发功能。

    5.6K143

    关于容灾的那些事儿

    在同步数据复制方式下,RPO等于数据传输时延的时间,在异步数据复制方式下,RPO基本为异步传输数据排队的时间。...但部分应用可能需要调整配置; 数据库:通过Oracle dataguard实现数据库复制,切换时需要将容灾机房的数据库服务器配置为主节点。...RPO:根据双活机房的同步复制,可达到数据零丢失; 灾备切换关键: Web、应用、数据库服务器:在HA集群上迁移虚拟机至容灾ESX主机上,然后启动虚拟机; 虚拟机文件、数据库文件均使用存储虚拟化技术实时复制...根据关键点,我们梳理一下真实的应用灾备演练的过程如下: 图片1.png 容灾应用管理 应用管理员,登录到SaaS后,首先添加目标灾备应用,包括应用系统基础信息、服务器对象、数据库对象等; image007...通过在线SaaS的方式,可集中添加多个灾备应用系统,并集中管理好每个核心的灾备预案,并且在每一次的灾备演练完成后,直接可在线更新和完善,同时记录其每次预案的更新信息,从而实现灾备演练目标—持续验证和完善灾备预案

    3.6K70

    Hbase容灾与备份

    一、前言 本文主要介绍 Hbase 常用的三种简单的容灾备份方案,即CopyTable、Export/Import、Snapshot。...已被删除的数据等功能; 执行命令前,需先创建与原表结构相同的新表; CopyTable 的操作是基于 HBase Client API 进行的,即采用 scan 进行查询, 采用 put 进行写入。...因为快照存储的仅仅是表的元数据和 HFiles 的信息。快照的 clone 操作会从该快照创建新表,快照的 restore 操作会将表的内容还原到快照节点。...HBase 配置了基于 Replication 的主从复制,由于 Replication 在日志级别工作,而快照在文件系统级别工作,因此在还原之后,会出现副本与主服务器处于不同的状态的情况。...这时候可以先停止同步,所有服务器还原到一致的数据点后再重新建立同步。

    1.9K40

    容灾演练-故障切换

    容灾设计需要进行故障切换的场景 容灾设计过程当中需要考虑的故障切换的场景有很多,数据中心内部的高可用切换不在本次讨论范围之内,我们讨论的是容灾恢复过程中的关键跨数据中心级的故障切换场景,从网络层到存储层都会涉及到...客户端保存两个DNS地址,根据网络线路的健康状况,由客户端操作系统选择第一步地址请求的DNS服务器地址,每个数据中心的DNS服务器一般会通过HA方式来避免设备的单点故障。...4.2 HA数据库服务模式 所谓 HA数据库服务模式是指通过操作系统HA软件结合数据库服务实现的容灾架构,架构设计之初是为了实现各类应用服务的本地服务器高可用,但双活容灾技术兴起之后,也常常被用来作为近距离...(百公里内范围)双活容灾的数据库服务架构 。...Extended RAC之类的容灾架构 。

    3.2K31
    领券