Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >云上容灾架构设计与方案

云上容灾架构设计与方案

作者头像
希望的田野
发布于 2020-03-10 10:37:06
发布于 2020-03-10 10:37:06
5.3K0
举报
文章被收录于专栏:信息化漫谈信息化漫谈

随着医疗、大型企业行业上云步伐的加快,上云后的业务系统安全性如何保障成为客户关注的重点。对于医疗、大型企业客户,往往建有自己的数据中心,如何保障极端情况下业务系统的稳定运行?双活、灾备,能帮到我们!

一、单数据中心架构的隐患

单数据中心的常见架构如下图所示,如果在该数据中心在极端情况下,出现网络全阻、设备掉电全阻等情况,业务可能发生全阻。大型数据中心一般为多路由的网络、电源拉入,出现此类情况的概率极低,但对于医疗、金融等客户,也会带来灾难。

在此架构下,一般建议至少买两台云主机,挂在负载均衡下面,避免单云主机出现业务中断。同时数据库与web、应用服务器不建议放在同一台云主机上,避免互相争抢资源,云端建议买RDS Paas服务,减少麻烦。

二、云上多AZ的应用高可用方案

一些云服务商在同一个城市部署了两个数据中心,中间通过高速的二层网络形成互连,形成了双AZ(可用区)的架构。

1、当可用区1的主用SLB中断时,会将IP地址浮动至可用区2的备用SLB上。该方式是通过BGP路由的动态路由检测来完成。

2、当可用区1的主用ECS全部中断时,主用SLB会将业务流量倒至备用区的ECS。因此高速的二层网络将在此时承担大量的数据流量。

3、当可用区1的主用RDS中断时,也将该主用RDS的ip地址浮动至可用区2的备用RDS库中。

三、线上、线下结合的应用高可用方案

如果希望将公有云及企业自建的私有云进行联动,可以采用如下的系统架构,该方式与双AZ方式有很大的区别。

1、通过智能DNS服务,实时两个SLB的连通性进行检测,当主用SLB中断时,进行秒极的检测,将备用SLB同步至全网的DNS服务器。

2、如果两朵云都是客户自建的,则可以通过高速网络进行二层互通,实现云主机的分组,相互倒流。

3、对于数据库的同步,可以通过数据库自带的脚本,或采用第三方的工具进行数据库的日志级同步。

四、两地三中心的应用双活架构

该架构实际是以上两种方式的结合。双活架构一般是发生是两个数据中心相邻距离不远的场景。如果对于金融级的客户,还会考虑异地的灾备。则采用以下的架构。保障双活的公有云中断时,异地的私有云还能够在一定的时间内接管业务。

五、数据灾备级的容灾方案

对于以上的方案,投入的代价较大,例如需要支付双活数据中心的高速通道费用、相同配置的云主机费用。因此对于一般中型企业,也会提出将数据进行灾备,保障当主用数据中心中断时,原有的私有云能够在几个小时的时间内容逐步恢复业务系统的运行。

该方案实际是企业用得较多的形式,就算业务没有恢复,但数据还在我自己的机房中有备份。

业内的实际方案较多,有基于硬件的灾备一体机,也有纯软件实现的方案。

1、例如下图,本地通过灾备一体机进行数据的压缩、加密、存储,同时在云端也进行一份灾备存储。这样当业务系统中断时,可以选择在云端恢复、或线下私有云恢复。

2、例如下图,也可以通过纯软件的方式进行灾备,直接将备份的文件放下云端、或线下私有云。

这两种方式本质上都是文件级的灾备方案,因此对于数据库等高可靠性的业务支撑不如日志级的数据同步方案。建议将灾备的周期可以设置为一小时及以上,以保障数据库的运行稳定安全。同时为避免数据库在异常情况下无法恢复,建议使用原厂的工具进行数据实时日志级同步,如Oracle DG、Mysql的主从脚本等。

六、小结

1、如果中型企业、资金预算较充足,可以选择双AZ方案、或线上+线下的双活高可用方案。

2、对于金融级客户,可以选择两地三中心的方案。

3、对于普通企业客户,可以选择数据级的灾备方案。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 信息化漫谈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
微服务高可用容灾架构设计
相对于过去单体或 SOA 架构,建设微服务架构所依赖的组件发生了改变,因此分析与设计高可用容灾架构方案的思路也随之改变,本文对微服务架构落地过程中的几种常见容灾高可用方案展开分析。
腾讯云中间件团队
2023/09/09
1.3K0
微服务高可用容灾架构设计
得物彩虹桥架构演进之路-负载均衡篇
一年一更的彩虹桥系列又来了,在前面两期我们分享了在稳定性和性能2个层面的一些演进&优化思路。近期我们针对彩虹桥 Proxy 负载均衡层面的架构做了一次升级,目前新架构已经部署完成,生产环境正在逐步升级中,借此机会更新一下彩虹桥架构演进之路系列的第三篇。
得物技术
2024/11/19
2280
容灾的架构分析和容灾选择策略
容灾半径是衡量容灾方案所能承受的灾难影响范围的指标。不同灾难的影响范围是不同的,而距离也会影响到容灾技术的选择。容灾中心的架构按照源备端之间的距离,可分为本地容灾、同城双活、两地三中心。
删库跑路886
2022/04/29
3K0
容灾系列(五)——数据库容灾建设
在一个数据为王时代,数据安全视为一家企业命根子,因此如何保障企业数据安全尤为重要。本文主要从数据库容灾方案视角,基于当前客户业务并结合技术&产品,制定最佳容灾方案。主要从以下三个方面来介绍:
开元
2021/10/21
8.5K2
容灾系列(五)——数据库容灾建设
聊聊高可用的“异地多活”架构设计
来源:https://blog.dogchao.cn/?p=299  前言 后台服务可以划分为两类,有状态和无状态。高可用对于无状态的应用来说是比较简单的,无状态的应用,只需要通过 F5 或者任何代理
程序猿DD
2022/10/11
1.8K0
聊聊高可用的“异地多活”架构设计
企业级 IP 电话系统高可用架构设计详解
设计高可用架构需要合理部署以下核心组件,每个组件的高可用性都直接影响系统的整体表现:
杜金房
2025/03/27
2620
企业级 IP 电话系统高可用架构设计详解
容灾系列(十二)——业务异地多活能力建设【方案篇】
异地多活相对于异地热备,最大不同点在于应用在不同地域都承载流量,从业务流量调度,数据同步以及业务性能等方面技术复杂度会大幅度的提升。同时业务异地多活有一个前提,就是业务支持单元化部署,这里对存量有历史技术债业务也存在非常大的挑战。因此本篇幅讨论异地多活前提是,业务已经具备单元化部署的能力。
开元
2022/12/09
2.4K0
容灾系列(十二)——业务异地多活能力建设【方案篇】
“两地三中心”和“双活”简介--容灾技术方案
当前市场上常见的容灾模式可分为同城容灾、异地容灾、双活 数据中心、两地 三中心几种。
kubernetes中文社区
2020/06/16
15.5K0
跨数据中心下的 Kafka 高可用架构分析
导语 本文介绍了 Kafka 跨数据中心的两种部署方式,简要分析两种方式下的不同架构以及优缺点,对这些架构可能碰到的问题也提供了一些解决思路;同时也说明了 Kafka 跨数据中心部署的社区解决方案和商业化解决方案。 背景 Kafka 作为世界上最流行的消息中间件之一,一般是客户数据链路中的核心组件,高可用性是客户很关注的因素。近期在对接云上客户时发现,客户对 Kafka 的高可用也有需求,行业架构师也想了解 Kafka 高可用的方案细节;有些客户是需要云上 Kafka 的高可用能力,有些客户需要 IDC
腾讯云中间件团队
2023/04/28
1.9K0
跨数据中心下的 Kafka 高可用架构分析
容灾系列(一)—— 云上业务容灾方案要如何选?
说起容灾,很多同学脑子冒出来熟悉字眼,”同城双活”,“两地三中心”,“单元化”,“set化”等等。其实这些名词背后均隐射一层含义,面对一些灾难时候,业务如何做冗余来快速恢复业务。
开元
2021/05/18
9.2K1
容灾系列(一)—— 云上业务容灾方案要如何选?
容灾演练-故障切换
容灾设计过程当中需要考虑的故障切换的场景有很多,数据中心内部的高可用切换不在本次讨论范围之内,我们讨论的是容灾恢复过程中的关键跨数据中心级的故障切换场景,从网络层到存储层都会涉及到,其主要涉及如下几个方面:
邓愉悦
2021/09/16
3K0
混合云应用双活容灾最佳实践
越来越多的企业在数字化转型和上云进程中选择混合云的形态(云+自建 IDC 或云+其他厂商云)来进行容灾建设,一方面不会过度依赖单一云厂商,另一方面还能充分利用已有的线下 IDC 资源。
IT运维技术圈
2022/10/24
3.3K0
腾讯专有云高可用设计内幕揭秘
导语 近几年,大型公有云故障引发的生产业务事故案例时有发生。由于很多开发者默认大型公有云的服务是一直可用的,在开发时没有针对公有云服务进行容错设计,在公有云故障时,就出现了业务的异常。可见,由于大型公有云实际上已经成为了全社会共同拥有的IT基础设施,其业务的高可用也已经成为了企业社会责任的一部分。腾讯云是如何通过完备的高可用设计,来保证云服务的业务连续性和数据持久性,从而承担大厂应有的社会责任的呢? 这篇来自腾讯专有云的架构师方天戟的万字长文为您揭开腾讯专有云高可用设计的内幕。 一. IT 业务高可用的
腾讯专有云
2023/01/01
7.4K0
腾讯专有云高可用设计内幕揭秘
如何设计高可用的云业务架构?
容错(fault tolerance)指的是, 单个组件发生故障时,业务还能继续运行。
binwenli
2019/12/13
2.5K1
如何设计高可用的云业务架构?
金融级高可用!天翼云TeleDB数据库如何实现容灾双活?
数据库作为企业数据的管理软件,是企业的核心资产,需要避免单点灾难,因此数据库灾备需求应运而生。
科技云报道
2022/12/08
3.1K0
金融级高可用!天翼云TeleDB数据库如何实现容灾双活?
商业银行基于容器云的分布式数据库架构设计与创新实践
本文介绍了某商业银行基于 TiDB 和 Kubernetes(简称 K8s) 构建的云化分布式数据库平台,重点解决了传统私有部署模式下的高成本、低资源利用率及运维复杂等问题。
PingCAP
2024/12/09
2640
商业银行基于容器云的分布式数据库架构设计与创新实践
如何利用腾讯云实现同城灾备?
灾难备份对于企业来说是一项非常重要的技术应用,对企业的数据安全起到很大作用。灾难备份,即灾备,是指利用科学的技术手段和方法,提前建立系统化的数据应急方式,以应对灾难的发生。其内容包括数据备份和系统备份,业务连续规划、人员架构、通信保障、危机公关,灾难恢复规划、灾难恢复预案、业务恢复预案、紧急事件响应、第三方合作机构和供应链危机管理等等。
删库跑路886
2022/10/31
2.3K0
如何利用腾讯云实现同城灾备?
首届云上广交会存储服务架构与实践
疫情压力下,广交会63年来首次整体搬上“云端”,首次整体搬上“云端”的广交会运行平稳,服务了217个国家和地区的采购商观展。作为本届广交会的技术服务商,腾讯为广交会网上举办提供整体技术支持、平台研发服务与云资源支撑。
hustxiong
2020/08/10
4.2K0
腾讯云高可用和容灾解决方案
实现业务连续性的技术手段通常包括高可用性和灾备恢复两种,所以本文讲述的是在腾讯云上实现业务连续性的解决方案。
聊high云
2018/03/13
12.1K0
腾讯云高可用和容灾解决方案
云时代数据容灾的正确姿势
2、确保应用高可用性,消除计划外的停机时间,减少计划外的停机时间,提高业务连续性。
嘉为蓝鲸
2019/06/21
2.1K0
云时代数据容灾的正确姿势
相关推荐
微服务高可用容灾架构设计
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档