在衡量系统高可用的时候,我们经常能看到几个专业词汇,例如RPO和RTO,像OceanBase号称可以做到RPO=0,RTO<30s,RPO和RTO代表了什么?...可以看出来,RTO和RPO服务于不同的目标,RTO涉及应用程序和系统,但主要描述应用程序停机时间的限制。RPO主要与失败事件后丢失的数据量有关。...因此,从客户的角度,如果某个服务节点发生了故障,肯定希望数据不丢(RPO=0),而且能尽快恢复(RTO 越小越好)。...因此,这种技术不仅能保证RPO=0,而且大大减小了RTO,相比传统“主从复制”技术来说可以提供更强大的高可用能力。...因此,分布式多副本数据一致性技术一定程度上可以提供客户所需要的RPO和RTO,尤其在互联网,企业级的实现,已经相对成熟,这算是技术进步给业务带来更高可用性的一个佐证。
RTO = Recovery Time Objective = 恢复时间目标 RPO = Recovery Point Object = 恢复点目标 其差别,一个是Time、一个是Point。...如果你的业务能够忍受30分钟之内启动起来,那么RTO就等于30分钟。 再比如,你的数据库当机了,30分钟后恢复了。如果你的业务能够忍受丢失最后2分钟的数据,那么你的RPO就是2分钟。...值得注意的是,任何宣称RTO=0和RPO=0的厂商,都是在吹牛皮。 单机服务 对于单机服务来说,从故障到恢复正常服务,它的间隔时间不可能是0。...所以RTO不会等于0。 但RPO倒是可以做到逼近0损失的。因为目前的数据库服务,大多数都会写一份预写日志来防止异常发生。...所以智能的服务还要有能够识别出机房和zone的能力,以便在发生问题时,B机房起码有一份数据时刻是最新的。
不过在 SYN 握手阶段,网络连接还没有建立起来,如果此时发生丢包,那么因为系统没有可以参照的 RTT(Round-Trip Time),所以此时只能给出系统缺省设置的 RTO: #define TCP_RTO_MAX...); mod_timer(&req->rsk_timer, jiffies + timeo); return; 可见 RTO 的最大值是 120 秒,最小值是 200 毫秒,在连接建立前的初始值是 1...秒,如果经过多次重传,每次 RTO 的值翻倍,但最大不得超过 120 秒: 第 1 次重传:超时时间是 2 的 0 次方,也就是 1 秒。...还有一点需要说明的是,在建立连接后,因为目前网络都很快,所以大部分连接的 RTO 都会接近 TCP_RTO_MIN,也就是 200ms,可以通过「ss -int」命令来确认。...关于超时重传还有很多细节需要考虑,下面列出一些资料: TCP/IP重传超时–RTO RTO对tcp超时的影响 linux下超时重传时间(RTO)的实现探究 RTO的计算方法(基于RFC6298和Linux
注意:本文分享给安全从业人员,网站开发人员和运维人员在日常工作中使用和防范恶意攻击,请勿恶意使用下面描述技术进行非法操作。...[TOC] 0x00 前言介绍 描述:说实在第一个看这个漏洞的时候是没挣明白的有点绕(大佬一眼应该就能观定),下面大致对PRO做一个介绍; 什么是RPO攻击?...RPO(Relative Path Overwrite)相对路径覆盖,是一种新型攻击技术,最早由Gareth Heyes在其发表的文章中提出。...和src引入JavaScript(会暂停直接进行解析并执行,并且连续载入两个JavaScript文件加载过程中会有一段时间的间隔,这段时间就是js代码执行的时间) 0x01 RPO漏洞原理(principle...) 原理:RPO漏洞相对路径覆盖并且源码中引用了相对路径css文件所导致的脆弱性漏洞,一般的可利用手段就是CSS攻击钓鱼和CSS-XSS 攻击。
[TOC] 0x00 前言介绍 描述:说实在第一个看这个漏洞的时候是没挣明白的有点绕(大佬一眼应该就能观定),下面大致对PRO做一个介绍; 什么是RPO攻击?...RPO(Relative Path Overwrite)相对路径覆盖,是一种新型攻击技术,最早由Gareth Heyes在其发表的文章中提出。...就目前来看此攻击方法依赖于浏览器和网络服务器的反应,基于服务器的Web缓存技术和配置差异,以及服务器和客户端浏览器的解析差异,利用前端代码中加载的css/js的相对路径来加载其他文件,最终浏览器将服务器返回的不是...和src引入JavaScript(会暂停直接进行解析并执行,并且连续载入两个JavaScript文件加载过程中会有一段时间的间隔,这段时间就是js代码执行的时间) 0x01 RPO漏洞原理(principle...) 原理:RPO漏洞相对路径覆盖并且源码中引用了相对路径css文件所导致的脆弱性漏洞,一般的可利用手段就是CSS攻击钓鱼和CSS-XSS 攻击。
(2)传播时延 传播时延是电磁波在信道中传播一定距离所需要花费的时间,传播时延和信道的传输速率无关, 而是取决于传输媒介的长度,以及某种物理形式的信号在传输媒介中的传播速度。...此外,在有优先级算法的网络中,排队时延还取决于数据的优先级和结点的队列调度算法。...(4)处理时延 处理时延是分组在中间结点的存储转发过程中而进行的一些必要的处理所花费的时间,这些处理包括提取分组的首部,进行差错校验,为分组寻址和选路等。...RTO(Retransmission TimeOut) 为了防止数据报丢失,当TCP发送一个报文时,就启动重传计时器,有2种情况: 1.若在计时器超时之前收到了特定报文的确认,则撤消这个计时器
关于RTO和RPO 谈完容灾级别的选择,我们来看下容灾的参数指标,有两个关键指标我们必须要了解:RTO和RPO。 RTO和RPO是灾难恢复方面的重要参数指标,可以很好地反映出容灾性能如何。...提升RTO的常用技术有:磁带恢复、人工迁移、应用系统远程切换,这几种技术的RTO的表现如下表所示: QQ截图20181225161817.png RPO(恢复点目标) RPO(RecoveryPointObjective...提升RPO的常用技术有:磁带备份、定期数据复制、异步数据复制、同步数据复制等,这几种技术的RPO的表现如下表所示: QQ截图20181225162709.png RTO和RPO关系 RTO和RPO指标并不是孤立的...我们用下面的图说明下RTO和RPO两个指标在故障处理过程中的关系: image002.png 几种常见的容灾技术和架构 几种常见灾备技术 软件复制:应用高可用、应用负载均衡、应用配置文件同步、VMware...异地容灾:某公司内部财务系统异地容灾架构 2.png 容灾级别:应用级容灾; 容灾技术:数据库复制(Oracle Dataguard)、应用配置文件复制; RTO:可达到分钟级别恢复; RPO:基本为异步传输数据排队的时间
让我来强调2点 1 数据库是恢复前一天夜间的数据,10个小时的数据库我们丢失了 2 4个小时的应用down机的时间 什么是 RPO recovery point objective 和 RTO...所以制定业务的RPO 和 RTO 后就直接可以确认你的备份的策略是什么,关于你POSTGRESQL 核心的备份的此类包含了: 备份的方法 (在线,离线,逻辑) 使用何种间隔来对数据库进行备份 (每周...然而,如果在磁盘界别另一个方案是针对存储管理中对磁盘进行快照的方式,这样会更快,尤其在你有一个非常大的数据库的情况下 (2T) 如何让RPO 和 RTO 达标 现在我们已经明白了RPO 和 RTO 对于我们的商业系统的重要性...commit ,这里备库就作为一个standby 的模式存在,实际上你可以在任何灾难的情况下,通过自动或手动转换到 standby的模式来减少RTO和RPO的问题,需要说明的是在应用事务未提交的情况下,...这里帮助我们来定义RTO 和RPO ,发现正确的基于backup, standby, DR 策略的正确解决方案,并且进行测试确认和最终的部署。
与之类似但更为主流的两个指标则是:RTO, Recovery time objective 和 RPO, Recovery point objective。...运维 系统或产品上线后,通过监控系统定期进行性能分析,验证设定的RTO和RPO目标是否合适并不断改进。...随着云计算技术和云原生应用开发越来越普及,在系统设计时充分考虑 Design for failure 变的越来越重要,需要我们根据RTO和RPO目标选择合适的技术手段应用在我们的项目上,下面列出了一些常用的技术手段或原则...根据RPO的要求设定合适的备份间隔。如果有多个可用区,你还要考虑在异地恢复应用时的数据传输时间。 主备切换。传统的高可用方式,相比于异地恢复,RTO能够控制的比较好。...这种模式能够提供最好的RTO和RPO指标,同时实现起来代价也是最高的。
这一故障的RTO为5秒,RPO为0。 2. 高可用建设目标 如1.1节中所述,高可用领域的建设目标可以从 RTO 和 RPO 两个维度进行衡量。...我们将 RTO 作为 X 轴,RPO 作为 Y 轴,二者交叉可以得到四个象限,如下图所示: 图2 高可用建设目标四象限 在图2中,我们通过业务的 RTO 和 RPO 是否为0,将业务高可用建设的目标划分为四个象限...右上象限是要求最高的场景,RTO 和 RPO 均为0。...总之,当单个计算/存储机柜发生故障时,对专有云TCE 上应用的影响在可控范围内,实际上总的 RTO 和 RPO 可以控制在分钟级别,如对应用的 RTO 和 RPO 有较高要求,在应用开发遵循一定规范的前提下...,能实现 RTO≈0,RPO=0。
不同业务需求对应的架构 单一地域 RTO=小时 RPO=分 一台MySQL服务器 备份 同步日志 ?...单一地域 RTO=小时 RPO=少于1秒 一台MySQL服务器 频繁备份 持续拉取二进制日志 ?...单一地域 RTO=数分 RPO=少于1秒 MySQL InnoDB Replica Set ? 单一地域 RTO=数秒 RPO=0 MySQL InnoDB Cluster ?...多地域 地域故障 RTO=数分 RPO=数秒 MySQL InnoDB Cluster 配合使用异步复制 ?...多地域 地域故障 RTO=数分 RPO=0 MySQL InnoDB Cluster 跨地域部署 两个地域的一致性级别设置为AFTER,或者三个地域,每个地域具有1-2个成员 写入的吞吐量受到影响
本文从常见的容灾方案和容灾架构入手介绍, 结合腾讯云多可用区容灾方案进行示例讲解。系统与数据容灾架构衡量容灾能力评价容灾能力主要是RPO和RTO两个指标。...RPO : 应发生故障时能忍受数据丢失的最大程度。系统越重要,要求 RPO 越小。...对整个生产环境和网络的压力越大,需要的成本也更高。...RTO: 应用从出现故障到故障恢复能接受的最大时间。系统越重要,要求 RTO 越小。...国家标准化管理委员会发布的容灾恢复RTO/RPO各等级对应关系如下:灾难恢复能力登记RTO RPO1 2天以上1至7天224小时以上1至7天312小时以上数小时至1天4数小时至2天数小时至1天5数分钟至两天
主要是利用浏览器的一些特性和部分服务端的配置差异导致的漏洞,通过一些技巧,我们可以通过相对路径来引入其他的资源文件,以至于达成我们想要的目的。...就目前来看此攻击方法依赖于浏览器和网络服务器的反应,基于服务器的Web缓存技术和配置差异,以及服务器和客户端浏览器的解析差异,利用前端代码中加载的css/js的相对路径来加载其他文件,最终浏览器将服务器返回的不是...02 — 背景分析 在分析RPO攻击技术之前,首先我们得先了解几个关于服务器和客户端浏览器在解析和识别上的差异性基础知识。...03 — 实战解析 第一个场景:加载任意目录下静态资源文件 我们看看下面一个测试环境: /rpo/111/1.php文件中通过相对路径加载了上层目录既/rpo/x.js和/rpo/x.sss文件。.../RPO_HACK/user/2/xxx时: 这里表示我们使用2/xxx作为参数访问user接口,返回的内容和使用参数2访问返回的内容相同。
RTO 值越小,代表容灾系统的恢复能力越强,但企业投资也越高。 RPO:Recovery Point Object,恢复点目标。灾难发生后,系统和数据必须恢复到的时间点要求。...系统容灾能力标准 我国的国家标准《GB20988-2007-T 信息安全技术信息系统灾难恢复规范》对容灾数据中心根据 RPO 与 RTO 两项指标分成了6个相应的等级,如下所示: 容灾等级 RTO RPO...,云平台和产品都需要进行相关的切换操作进行恢复,操作的步骤很多很复杂,需要有一个系统能够屏蔽切换细节简化容灾切换的步骤,提升切换效率,有效降低 RTO; 需要能够通过容灾演练验证已建成容灾系统的可用性、...数据类产品基于实例级的数据同步监控,能够查看每个实例的数据同步状态,RPO 指标等。 容灾演练 容灾演练支持演练的故障场景包括 MAZ 隔离、SAZ 隔离和 MAZ&SAZ 脑裂三种场景。...结语 容灾是一项系统工程,需要容灾管理系统(DRMS)和云平台配合提升,才能有效提升系统的容灾能力,提升 RTO/RPO 指标。
中国金融行业IT系统容灾标准采用六级分类,分为1-6级,对应不同的恢复时间目标(RTO)和数据恢复目标(RPO)。...二级容灾标准: RTO:4小时内 RPO:1小时内 适用于对业务连续性和数据安全有较高要求的金融机构,如中型银行、金融服务公司等。...三级容灾标准: RTO:8小时内 RPO:2小时内 适用于对业务连续性和数据安全有一定要求的金融机构,如小型银行、信用合作社等。...四级容灾标准: RTO:12小时内 RPO:4小时内 适用于对业务连续性和数据安全有较低要求的金融机构,如金融科技公司、支付机构等。...监管机构对业务恢复时间(RTO)和数据恢复点(RPO)等关键指标有明确要求。 系统测试与演练:金融机构需要定期对容灾系统进行测试和演练,确保系统具备足够的恢复能力。
这还要看业务部门对RTO(恢复所需的时间指标)/RPO(能够恢复到的最新状态)指标的 期望值,如果允许1TB的数据库RTO=8小时,RPO=1天,那备份系统就能满足要求。...能够提供很好的RTO和RPO指标。...(2)允许的RTO和RPO指标 从技术上看,衡量容灾系统有两个主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了当灾难发生时允许丢失的数据量...;而RTO则代表了系统恢复的时间。...一般而言:容灾系统能够提供较好的RTO和RPO指标。 ? ?
二、国家对数据灾备恢复有六级的分类 对于2、3级的一般性业务,至少保证每天备份一次,RPO/RTO按天级别。即数据允许丢失、数据恢复的时间可以是天级别。...对于4级的重要业务,至少每天全量+增量备份,RPO/RTO从小时到天级别。 对于5的关键业务,要求数据丢失不能超过30分钟,即RPO小于等于30分钟。并能够在分钟级别恢复业务,即RTO分钟级。...对于6的核心业务,则要求做到数据零丢失,即RTO为0,RTO为分钟级。 三、云计算能帮助用户在数据灾备做到哪些? 云计算能够在1-5级的灾备场景提供服务。...1、数据备份解决方案(应尽量缩短RPO时间,也就是数据损失的时间量)。 原理:客户可以将线下服务通过工具备份至线上的普通块存储、NAS、或对象存储中。...2、数据库快速恢复解决方案(应尽量缩短RTO时间,也就是数据恢复的时间量) 原理:当主用数据库中断时,能够通过快速切换数据库,将业务切换到正常工作的数据库上。
企业业务敏感程度差异,对容灾指标RPO&RTO要求也不同。之前两篇文章主要介绍数据冷备,主要特点是数据备份存储非实时,备份系统存储数据通常昨天的数据,当灾难真正来临的时候,今天新产生的数据会丢失情况。...热备对数据是实时复制备份,加强对数据的完整性保障,相对于冷备方案,RPO指标提升到秒级别。由于该方案只做异地数据实时备份,RTO指标依赖于业务部署能力,通常为分钟级。...数据热备有两个关键词分别为“异地”和“实时”,需要在再次强调一下。异地明确数据热备容灾能力,实时明确RPO指标接近于“零”。尤其是实时,对于RPO指标提升,为此需要企业投入更多的成本。...本文小结数据热备主要是提升RPO指标,几乎接近为“零”;同时借助平台能力有效提升RTO指标。...方案关键因素详细说明容灾范围地域级别容灾RPO/RTORPO几乎接近为零;RTO为小时级别,进行1:1业务部署,依赖于业务部署和数据恢复自动化能力。
二、InnoDB Cluster和InnoDB Replica Set 上面简要介绍了MySQL高可用的过去和现在的解决方案,下面将详细地介绍InnoDB Cluster和InnoDB Replica...可以从以下几个方面去明确目标: 恢复时间目标(RTO) 服务从故障中恢复需要多长时间?...不同业务需求对应的架构 单一地域 RTO=小时 RPO=分 一台MySQL服务器 ○ 备份 ○ 同步日志 单一地域 RTO=小时 RPO=少于1秒 一台MySQL服务器 ○ 频繁备份 ○ 持续拉取二进制日志...单一地域 RTO=数分 RPO=少于1秒 MySQL InnoDB Replica Set 单一地域 RTO=数秒 RPO=0 MySQL InnoDB Cluster 多地域 地域故障 RTO...=数分 RPO=数秒 MySQL InnoDB Cluster ○ 配合使用异步复制 多地域 地域故障 RTO=数分 RPO=0 MySQL InnoDB Cluster 跨地域部署
业务数据备份采用热备方式,容灾指标RPO接近“零”;但是RTO指标还是依赖于业务部署测试自动化能力。业务会进一步需要,在数据热备技术架构下,在成本可控的情况下,是否能进一步提升RTO指标呢?...方案背景数据热备,相对于数据冷备,通过数据实时同步,对于RPO指标有了质的提升,达到了业务双活的标准。但是业务恢复指标RTO没质的提升,主要是业务部署验证需要花费时间过于依赖企业运维自动化能力。...极端情况出现后,业务恢复省去资源购买,业务部署时间,大幅度缩减RTO耗时,从本质上可以提升RTO时间。...业务恢复:数据层面控制台对redis切换为主实例完成恢复;业务层面通过AS和EKS动态扩容自动完成,业务流程修改DNS解析后快速恢复,RPO为秒级别,RTO预计5分钟内。...方案关键因素详细说明RPO/RTORPO接近为0;RTO分钟级别资源费用备份区实现最小化部署业务改造备份区业务需要适配数据资源地址数据备份依赖于云平台的数据备份能力,数据备份和恢复成本几乎为0。
领取专属 10元无门槛券
手把手带您无忧上云