Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >容灾系列(七)——混合云公网出口容灾建设

容灾系列(七)——混合云公网出口容灾建设

原创
作者头像
开元
修改于 2021-12-29 10:05:12
修改于 2021-12-29 10:05:12
3.4K0
举报
文章被收录于专栏:开元说说开元说说

企业系统架构的形态为混合云模式,即IDC和云平台共同承载线上业务流量,来保证业务高可用。墨菲定律告诉我们,如果事情有变坏的可能,不管这种可能性有多小,它总会发生。如果IDC公网出口异常,IDC内业务要访问第三方服务,如何实现高可用呢?本文结合云平台公网能力,从网络平台角度来分析容灾建设可行性。

1.混合云网络现状

数据中心公网出口和当地运营商对接,情况千差万别,虽然IDC机房出口线路有多条线路,如果运营商接入口或者IDC出口故障,会导致整个IDC丧失公网能力。在这类场景下,公网入口流量可以通过dns解析方式将业务流量切换到云平台;对于IDC出口流量调度只能通过业务层面调度来实现,涉及到业务调度各个企业实现方式不同,业务改造难度差异也较大。通常混合云网络架构如下:

混合云网络架构
混合云网络架构

关于混合云网络架构重点说明如下:

  1. 云平台和IDC互通。通常专线接入选择不同的POP,多条专线实现互通和高可用。
  2. 云平台公网出口能力为EIP。入口流量通过CLB进行分发;出口流量通过NAT网关(即绑定EIP);服务器直接绑定EIP来访问公网。
  3. IDC公网出口有公网IP地址。入口流量通过F5或者api网关来承载流量,出口流量通过自建NAT集群来访问公网。

2.公网出口容灾方案

2.1 IDC和云平台出口互为主备

正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到云平台,同样云平台公网出口异常,流量切换到IDC。结合当前云平台兼容性,方案关键点:

  1. 承载公网流量切换的专线网关必须为VPC类型网关,非云联网类型,目前受限于平台产品能力。
  2. 云平台NAT网关不支持流量导入,需要企业在VPC自建流量转发系统,推荐流量出口选择直接绑定EIP模式,流量更可控。

整体公网出口容灾方案如下:

IDC和云平台主备方案
IDC和云平台主备方案

2.1.1 云平台切换方案。

正常情况下,业务流量通过NAT访问公网,如上路绿色线条标识。云平台对于NAT和专线网关暂不支持ECMP,因此正常情况下,需要开启NAT路由,关闭专线网络路由,详情如下:

正常情况下路由表信息
正常情况下路由表信息

当NAT集群异常,云侧切换路由,通过专线网关将流量导入到IDC公网出口。切换动作目前只支持手动切换,通过调用API接口(DisableRoutes/EnableRoutes),关闭NAT网关选路,同时开启专线网络路由。云平台路由表信息如下:

平台NAT异常路由表信息
平台NAT异常路由表信息

业务回切。待业务恢复后,在一个业务低峰期时候,通过调用开启和关闭子子网路由来切换。

2.1.2 IDC容灾切换方案

正常情况下,IDC业务流量通过NAT访问公网,如上路绿色线条标识。云平台路由表,公网出口通过NAT信息如下:

正常情况下路由表信息
正常情况下路由表信息

当IDC公网出口异常情况下,IDC需要切换路由通过云平台的公网出去。这里手动调用api接口(ReplaceRoutes)对云平台原先由表进行替换来实现,因为同一张表里目标0.0.0.0存在,当使用专线网关路由被启动后,必须要同时关闭NAT网关和服务器公网IP。下这张路由表来替换原有路由表,两张路由表唯一差异就是目的端0.0.0.0一个为专线网关,另外一个为公网IP。

PS:云服务器公网IP:云服务器绑定有公网IP时优先走公网IP访问公网,仅仅转发IDC公网流量。

IDC出口异常云平台路由表信息
IDC出口异常云平台路由表信息

业务回切,在一个业务低峰期时候,通过替换路由表来切换。

2.2 IDC机房公网出口容灾方案

正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到IDC备用公网出口通道,同样云平台公网出口异常,流量切换到云平台公网出口通道。结合当前云平台兼容性,方案关键点如下:

  1. 公有云公网出口具备高可用能力。例如上海地域公网出口异常,通过腾讯云内网将流量调度到南京或者广州公网出口,来恢复业务。
  2. 云平台VPC子网路由通过绑定多个可用区NAT网关,同时NAT网络绑定多个EIP来实现高可用。
  3. IDC机房公网出口,可以通过借助云平台互联网专线通道能力,获取云平台的公网能力,实现IDC机房公网出口备用线路。
IDC机房公网出口
IDC机房公网出口

2.2.1 云平台切换方案

正常情况下,业务流量通过两个NAT网关随机访问公网,推荐NAT网关绑定两个以上EIP。

正常情况下路由表信息
正常情况下路由表信息

当NAT集群异常,云平台通过内网流量调度到其他地域来恢复,可能会对业务方案时延有增加,客户侧不需要做任何操作。如果只是其中一个NAT网关异常,通过手动调用API方式来关闭异常网关路由来恢复,如下图所示。

其中NAT故障路由表信息
其中NAT故障路由表信息

当集群恢复后,通过开启路由来恢复两个NAT负载流量。

2.2.2 IDC切换方案

正常情况下,业务流量通过IDC数据中心公网来访问,如绿色线条标识。当IDC数据中心公网出口异常时候,通过切换到云平台的互联网通道来进行公网访问。云平台侧不需要做任何修改。

3.方案对比小结

方案

优势

挑战

IDC和云平台互为主备

/

1.自建网络转发系统。 2.增加后续系统维护成本,保证系统稳定性。 3.网络工程师人员要求较高。 4.方案落地周期较长。 5.方案实现较为复杂,不确定因素较多。

IDC公网出口容灾方案 (推荐)

1.方案简单,更多依赖云平台能力 2.方案落地快捷。 3.人力成本低,不需要自建系统。 4.维护成本低,不需要后续维护系统稳定性。

1.需要增加互联网专线通道有额外成本。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
容灾系列(三)——云网络容灾建设
网络属于基础设施部分,网络容灾建设作为一个数据中心验收重要指标。试想一个数据中心的网络链路存在单点,就如一个城市道路都是单行道,一旦出现交通事故,小则导致道路拥堵,大则导致整个城市交通瘫痪。IDC时代,业务对网络容灾参与较少,主要依赖数据中心网络容灾建设程度;当到了云的时代,云服务商将底层网络能力产品化后,云上客户更多参与网络容灾建设,提升业务稳定性。本文从云网络概述,云网络容灾复杂度以及典型案例来介绍云网络容灾建设。
开元
2021/08/09
5K0
容灾系列(三)——云网络容灾建设
Elasticsearch跨集群复制(CCR)之腾讯云ES跨地域容灾
腾讯云ES目前已经提供了多可用区部署,即支持同地域跨机房的高可用容灾方案,满足了绝大多数客户的需求。但是依然会有部分客户希望进一步提升容灾级别,能够做到跨地域容灾。随着腾讯云ES双网卡功能的发布,使得跨地域容灾成为可能。接下来我将介绍下腾讯云ES实现跨地域容灾的详细步骤。
吴容
2020/08/18
5.2K3
Elasticsearch跨集群复制(CCR)之腾讯云ES跨地域容灾
混合云演习常见案例
当检测到物理线路1发生故障,系统自动将流量切换至物理线路2,保证业务正常运行。故障修复后,流量自动切回。
怡然自得
2022/06/21
1.5K0
腾讯云高可用网络的修炼之道
当他睡眼惺忪、手拿红牛、嘴刁香烟迈着沉重的步伐从某网络核心机房走出来的时候,除了看门大爷简短问候之外,也只有刚刚过去的这个黑夜才真正懂得刚刚发生了什么,在外人眼里,这个夜晚再正常不过,和往常一样,刷刷微博、看看抖音,逛逛购物网站,即便是前一晚上有某些人觉得打开购物网站的页面有点卡慢,他们也可能不会放在心上,然而正是因为这样一个不一样的网络体验,网络工程师们已经是废寝忘食,鏖战了整整一夜,来修复引发这个网络卡慢的bug,在外人眼里一觉醒来,看似波澜不惊,但有时实则是暗流涌动;
abelbai
2020/10/31
12.5K2
腾讯云高可用网络的修炼之道
腾讯混合云网络设计白皮书
从1999年,公认的云计算先驱-Saleforce.com公司成立,到2006年,Amazon发布了名声大噪的EC2(Elastic Compute Cloud),首次面向公众提供基础架构的云服务产品-IaaS,中间经历了七年的时间。
abelbai
2023/04/26
4.3K1
腾讯混合云网络设计白皮书
Elasticsearch跨集群复制(CCR)之腾讯云ES跨地域容灾
腾讯云ES目前已经提供了多可用区部署,即支持同地域跨机房的高可用容灾方案,满足了绝大多数客户的需求。但是依然会有部分客户希望进一步提升容灾级别,能够做到跨地域容灾。随着腾讯云ES双网卡功能的发布,使得跨地域容灾成为可能。接下来我将介绍下腾讯云ES实现跨地域容灾的详细步骤。
腾讯云大数据
2021/01/08
3.7K0
Elasticsearch跨集群复制(CCR)之腾讯云ES跨地域容灾
腾讯云虚拟网络架构揭秘
腾讯云开发者社区
2017/12/12
9.6K0
混合云应用双活容灾最佳实践
越来越多的企业在数字化转型和上云进程中选择混合云的形态(云+自建 IDC 或云+其他厂商云)来进行容灾建设,一方面不会过度依赖单一云厂商,另一方面还能充分利用已有的线下 IDC 资源。
IT运维技术圈
2022/10/24
3.3K0
数栈数据安全案例:混合云环境数据库备份容灾实现
FlinkX是一个基于Flink的批流统一的数据同步工具,既可以采集静态的数据,比如MySQL,HDFS等,也可以采集实时变化的数据,比如MySQL binlog,Kafka等,是全域、异构、批流一体的数据同步引擎,大家如果有兴趣,欢迎来github社区找我们玩~
袋鼠云数栈
2021/05/14
5980
数栈数据安全案例:混合云环境数据库备份容灾实现
记一次混合云API暴露的反思
客户为金融企业对SLA要求及数据安全性很高,有限于考虑到业务的高可用性,采用混合云部署,业务流量入口为阿里金融云,前端可以添加安全设备WAF/CDN/高防IP等,之后Cname到统一入口SLB负载均衡上,后端采用虚拟服务器组,组内ECS部署在同Region的不同Zone,保障跨Zone的靠可用性,考虑到数据的安全性将数据持续化在IDC侧,阿里云与IDC通过云上部署深信服设备与IDC侧Cisco设备通过Ipsec ×××互联(考虑到稳定性目前已经实施专线互通),后端APP-Server与DB-Server部署在IDC,可参考下图:
迅达集团
2019/03/05
1.7K0
记一次混合云API暴露的反思
如何利用腾讯云BGP网络提升客户外网出口的冗余
最近几年,互联网公司发展迅速,有很多互联网公司本身的基础架构都构建在一些公有云厂商之上,除了节省初期投资之外,另外也是借助于一些大的云厂商本身的网络能力,实现业务更好的覆盖。
张小波
2018/10/25
7K2
如何实现混合云场景下的接入层统一?
01. 什么是混合云? 混合云是近年来云计算的主要模式和发展方向,私有云主要是面向企业用户,出于安全考虑,企业更愿意将数据存放在私有云中;但是同时又希望可以获得公有云的计算资源,混合云的诞生就是为了解决云连接的问题。 理论上,任何两个异构的云连接在一起都可称作混合云。它可以是私有云与公有云之间,公有云与公有云之间,甚至是私有云与私有云之间。但通常意义上,我们所指的混合云是指私有云与公有云的混合。 混合云能将不同云之间的资源进行混合和匹配,以获得最佳的效果,这种个性化的解决方案达到了既省钱又安全的目的。多家
腾讯云serverless团队
2021/05/28
1.5K0
容灾系列(一)—— 云上业务容灾方案要如何选?
说起容灾,很多同学脑子冒出来熟悉字眼,”同城双活”,“两地三中心”,“单元化”,“set化”等等。其实这些名词背后均隐射一层含义,面对一些灾难时候,业务如何做冗余来快速恢复业务。
开元
2021/05/18
9.3K1
容灾系列(一)—— 云上业务容灾方案要如何选?
专线相关操作指导—静态、BGP单通道对接
专线相关介绍可参考https://cloud.tencent.com/document/product/216
pinkcchen
2020/11/19
3.8K0
专线相关操作指导—静态、BGP单通道对接
Elasticsearch 跨集群复制(CCR)之腾讯云 ES 跨地域容灾
腾讯云 ES 目前已经提供了多可用区部署,即支持同地域跨机房的高可用容灾方案,满足了绝大多数客户的需求。但是依然会有部分客户希望进一步提升容灾级别,能够做到跨地域容灾。随着腾讯云 ES 双网卡功能的发布,使得跨地域容灾成为可能。接下来我将介绍下腾讯云 ES实现跨地域容灾的详细步骤。 一、对等连接 (https://cloud.tencent.com/document/product/553/18836from=10680) 首先将北京和上海的两个 vpc 建立对等连接,如下图所示: 新建对等链接 注
腾讯云大数据
2020/10/28
2.4K0
容灾系列(五)——数据库容灾建设
在一个数据为王时代,数据安全视为一家企业命根子,因此如何保障企业数据安全尤为重要。本文主要从数据库容灾方案视角,基于当前客户业务并结合技术&产品,制定最佳容灾方案。主要从以下三个方面来介绍:
开元
2021/10/21
8.6K2
容灾系列(五)——数据库容灾建设
中间件PaaS层组件容灾方案及实践
当下,随着数字化技术不断深入,愈来愈多企业将核心业务搬到线上。业务系统高可用、可扩展、容灾能力决定企业系统的连续性,中间件作为构建企业核心系统的重要组成部分,其高可用容灾能力也将决定应用系统的。本文结合腾讯云中间件各PaaS产品的容灾能力及实践,以一个行业头部客户业务容灾实践举例,来展开说明基于腾讯云中间件PaaS层相关产品的实践。
邓愉悦
2021/05/31
4.4K12
基于 Rainbond 的混合云管理解决方案
内容概要:文章探讨了混合云场景中的难点、要点,以及Rainbond平台在跨云平台的混合云管理方面的解决方案。包括通过通过统一控制台对多集群中的容器进行编排和管理,实现了对混合云中应用的一致性管理。文章还介绍了Rainbond平台在混合云环境下的应用模板交付、跨云团队管理等功能,帮助用户简化跨云平台的应用交付和运维操作。
Rainbond开源
2023/05/04
4910
【云+社区年度征文】带宽利用率提升50%,腾讯云联网架构方案解析
导语| 企业A是一家互联网公司,当前在云上计算资源已经接近10W核,华东地域专线流量24G+,资源部署以华东为主、华北、华南、西南等可用区为辅。该企业属于典型的混合云架构,本文主要分享企业A如何通过云联网架构优化实现带宽利用率提升50%?
binwenli
2020/11/30
6K0
【云+社区年度征文】带宽利用率提升50%,腾讯云联网架构方案解析
从架构到应用,全面解析混合云的优势
云计算在2016年有了极大的增长。一方面,AWS、阿里云等大型公有云厂商的云计算收入呈爆发式增长且绝对值数据可观;另一方面,通过持续市场培育,云计算的价值逐步被各国政府所认可。很多大型企业也纷纷发力云计算,传统IDC采购出现增长拐点。各种声音不断提醒人们,云计算不再是雷声大雨点小的噱头,而是成为大中小企业不可或缺的基础设施。2017年,云计算真正落地的话题逐渐成为业界讨论的热门话题。   当前,私有云和公有云相争的热潮渐弱,融合两者优势的混合云开始逐渐释放巨大的市场潜力。混合云的背后不再是厂商,而是一种混合
BestSDK
2018/03/02
1.2K0
从架构到应用,全面解析混合云的优势
推荐阅读
相关推荐
容灾系列(三)——云网络容灾建设
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档