腾讯游戏服务器引擎(Game Server Engine,缩写GSE),支持有状态的游戏服务部署和扩缩容,实现服务发现、高效灵活的服务器伸缩和就近调度的能力,帮助开发者快速构建稳定、低延时的多人游戏的部署环境...这是一个有状态的扩缩容场景:对于游戏服务,尤其是对战服务来说,不能是简单添加一个clb(负载均衡)就能搞定。在游戏服务里需要断线重连,能找到之前连接的服务器;另外游戏过程不能因为缩容中断游戏。...成本节约 服务器空闲导致的成本,如以下这些情况: · 每日&周末&节假日的高峰波谷 · 游戏稳定运营及下降期,服务器空闲资源 · 活动期间,爆发增长,活动过后需资源空闲 比起游戏运营成本来说,服务器成本算不了什么...游戏服务器引擎(Game Server Engine,缩写GSE)提供专用游戏的服务器托管服务,支持有状态的游戏服务部署和扩缩容,实现服务发现、高效灵活的服务器伸缩和就近调度的能力,帮助开发者快速构建稳定...不需要提前在多个区域部署相同数量的服务器,从而达到0成本容灾的效果。 9.png 4. GSE和普通弹性伸缩的区别——GSE专注于有状态扩缩容场景 游戏中有两个特殊需求:断线重连、游戏中不能退出。
,活动之间相互割裂,缺乏沉淀复用和共享 运营活动快上快下的特点非常适合跑在 TKE 环境,利用其弹性伸缩、快速扩缩容特性应对活动突发流量。...自动扩缩容,极大的提升了周期性游戏活动资源准备效率。...网关运营监控指标 业务容器性能监控指标 官网营销活动 官网营销活动HPA实践 业务需求场景:营销活动有定点开启特性,开启时流量会突增,且生命周期内流量波动较大,对资源有弹性扩缩容需求。...需求 最终效果 分钟级扩容 优化后的 HPA 直接从 Metrics Server 取负载数据,扩容可以做到1分钟左右 原生 HPA 仅支持 Pod 粒度的 metric 计算,需要针对业务容器进行扩缩容...container 时业务容器负载高,但是 Pod 整体负载低情况下可以扩容 支持 request、limit 多种方式触发 HPA 支持按 request、limit 的方式 HPA,覆盖不同的业务场景 扩缩容事件
自动化扩缩容的目的主要有三个部分,首先是用户体验的保障,我们必须以最快的响应速度去应对用户增长的需求,否则必然会出现大规模的掉线或者拥挤排队,影响游戏基本体验;其次是资源的最有效利用,英雄联盟业务的单位运营成本...关于自动化扩缩容利器的用户交互,主要用的是类似汽车的仪表盘的形式来展示相关扩缩容时实施人员比较关心的数据。如图(2) ?...所向披靡-无所不能的容量云: 二期功能加入了监控和自动触发、缩容等功能,真正实现采集性能数据、按照模型分析出结论、实施扩缩容、性能数据达标等一系列操作,流程上把容量管理这件事做成闭环。...自动采集数据、分析出决策、实施扩缩容操作的整体流程架构图如下: ?...才将云中的服务器扩到游戏大区中;如红色的箭头所示,通过自动化的缩容,我们做到了自动化的将游戏大区中,尚且富余的服务器资源返还给业务云,然后由云在分配给需要使用的游戏大区,这样通过自动化的扩、缩容服务,我们做到了服务器资源自动化的动态调用
3.现网变更频繁,前端版本、后端版本发布,系统配置调整、营销活动规则调整等各种变更每天加起来平均300+次,大家都知道,变更带来的故障通常占到了现网故障的75%以上,所以在这么变更频发的平台上进行营销活动资源扩缩容...在这里的自动化扩缩容设计里,现网大盘由服务组成,服务由系统实例组成,而实例承载的基础是腾讯计费自研的TDF程序框架;扩缩容的核心大脑就是TSM自动化管理平台,压测平台周期性压测现网容量,现网内存、负载、...这里采用KVM虚拟机构建用于自动扩缩容的资源池,共享资源池会在日常扩容中出库消耗,在缩容中退库,这样持续的循环。...以上介绍了自动化决策和自动化扩缩容的机制,那么是不是有了这些自动化机制就万无一失了呢?...一是大盘容量的压测机制,二是快速扩缩容机制,以及资源共享管理、变更扫描,和限频保护措施。 构建之后,自动化保障体系可以浓缩为如下示意图。
3.现网变更频繁,前端版本、后端版本发布,系统配置调整、营销活动规则调整等各种变更每天加起来平均350+次,大家都知道,变更带来的故障通常占到了现网故障的75%以上,所以在这么变更频发的平台上进行营销活动资源扩缩容...在这里的自动化扩缩容设计里,现网大盘由服务组成,服务由系统实例组成,而实例承载的基础是腾讯计费自研的TDF程序框架;扩缩容的核心大脑就是TSM自动化管理平台,压测平台周期性压测现网容量,现网内存、负载、...这里采用KVM虚拟机构建用于自动扩缩容的资源池,共享资源池会在日常扩容中出库消耗,在缩容中退库,这样持续的循环。...如何确保扩缩容变更精准无误 一开始有提到,在日常频繁变更的现网大盘上进行扩缩容操作,故障风险是非常高的,那么怎么确保这里的变更准确性呢?也就是怎么确保扩容上去的资源服务没有问题。...如何防止大盘雪崩风险 以上介绍了自动化决策和自动化扩缩容的机制,那么是不是有了这些自动化机制就万无一失了呢?
TDSQL-C Serverless 的技术实现 传统云数据库并没有实现自动扩缩容、按使用量计费、无使用无费用。...在现实里,如果游戏厅就在你房间旁边,你房租的价格也会比其他地方的更贵。 计算跟存储分离,就是让房子和客厅解耦。只要解决传送问题(自动扩缩容)就可以让这个房间的成本回归到它本身的价值。...常见的自动扩缩容业务场景 慢查询。...当然你也可以选择在活动前扩容,活动后缩容。但这总的也不方便,而且并不是所有的活动都有足够的时间去规划。所以这时候就需要一个自动扩缩容的能力。 定时任务。很多业务都会有定时任务的需求。...虽然你也可以根据计划去手动扩缩容。但有些计划使用的计算资源不可控,时间也不可控。少了速度慢,可能还会影响到线上业务,多了又会浪费。
在现实里,如果游戏厅就在你房间旁边,你房租的价格也会比其他地方的更贵。 计算跟存储分离,就是让房子和客厅解耦。只要解决传送问题(自动扩缩容)就可以让这个房间的成本回归到它本身的价值。...TDSQL-C Serverless 数据库特点 自动扩缩容 按使用量计费 无使用无费用 我们希望你想要请求的时候,这个水资源能像瀑布一样倾泻而下,不需要业务提前感知。...当然你也可以选择在活动前扩容,活动后缩容。但这总的也不方便,而且并不是所有的活动都有足够的时间去规划。所以这时候就需要一个自动扩缩容的能力。 定时任务 很多业务都会有定时任务的需求。...虽然你也可以根据计划去手动扩缩容。但有些计划使用的计算资源不可控,时间也不可控。少了速度慢,可能还会影响到线上业务,多了话又是浪费。...用户数激增:自动扩缩容。 小微项目:小规格实例 …… 目前我们做到了很多,未来我们还有很多可以去做。
背景 对于FPS[2]、MOBA[3]等在线多人游戏后台架构中,都有专门服务玩家对局的服务器Dedicated Server(简称 DS)[4]。 下图是典型的游戏 DS 架构: ?...比如很多游戏业务都希望实现定时扩缩容,甚至应用自己控制 Workload 副本数量。 业界已经有一些开源项目去尝试解决这类游戏服务的 DS 管理问题,比如 Google 的Agones[8]。 ?...Squad 和 GeneralPodAutoscaler 提供了一些扩展和交互机制,变更,或者扩缩容时,GameServer 可以更加优雅的退出,避免对游戏玩家的影响。...应用定义缩容顺序 缩容时,可由应用指定缩容的顺序。例如,缩容时,应用可以选择玩家数量的 DS 副本删除。这不仅可以降低缩容开销,还可以提高底层的资源利用效率。...更好的与集群扩缩容(CA)工作 基于应用确认机制,缩容时,CA 可以选择任意的副本进行删除,不用担心对用户的影响。 基于 OCGI 的游戏后台架构 ?
OTO 服务通过基于 Kubernetes 的 GDP(游戏微服务开发平台),可以快速部署、自动扩缩容和资源回收复用。...再配合 K8s 的 HPA 即可自动根据后端性能指标扩缩容,极大提升资源利用率。 Pulsar 还支持对单个消息独立 Ack,可以很好地防止重复消费。...这样所有服务都在云端通过 K8s 调度,有高可用保障,只需调整副本数即可轻松扩缩容。 基于事件总线的事件分发 事件总线用于规范事件管理,事件按业务和类型维度管理。...K8s 支持 HPA,通过监控容器 CPU 和其他内存指标,当达到一定阈值时,触发服务扩缩容。这对一些队列消费服务不适用。...我们计划扩展 K8s 的 HPA,在监控 CPU 和内存等指标基础上再监控 msgBacklog,增强扩缩容灵活性,防止消息堆积。
通过云上的容器化部署、自动扩缩容、健康检查、可观测性等手段,提高了知几项目的持续交付能力和稳定性,形成了一套适合游戏知几自身的上云实践方案。...,需要发布最新版本才能扩容; 依赖的权限(mysql 等)需要申请; 平台操作繁琐,容易出错; 需要人工完成运营活动后机器的缩容操作。...基于上述的部署方案,利用云原生的自动扩缩容能力可以方便地解决上述问题: STKE 提供的定时 HPA 和动态扩缩容能力,可以很好的解决节假日、运营活动的流量突增带来的服务稳定性问题,且流量平稳后的自动缩容可以有效的节约资源...由于 HPA 会导致业务容器的扩缩容,如果流量在服务未完成启动时接入或者流量还在访问时接销毁 pod,会导致流量的损失,因此需要开启就绪检测和 prestop 配置。...特别是定时 HPA,可以很方便的满足知几在未成年人保护方面对扩缩容的要求,系统可以在特定时间段完成系统容量的扩容和缩容,在保证系统平稳应对流量的同时也不会造成对资源的浪费。
应用于腾讯IEG 80%的营销活动以及多个内部平台。经历各种秒杀活动、游戏周年庆以及节假日,取得很好实践效果,保障了系统安全运营。现将ModernFlux对外开源,为微服务开源社区贡献力量。...数据传输具有容错机制,流控服务具有健壮性并有容灾机制。 ...2.业务扩缩容对负载保护系统无感知,即系统对业务扩缩容透明。 3.在保证流控精度前提下,对业务流量(剧烈)变化不敏感,无需频繁扩缩容。...应用场景有营销活动(如秒杀/周年庆),电商大促,多业务混布虚拟隔离。 大型游戏秒杀营销活动入口流量难以预估,由于流量瞬间暴增和营销资源有限,单纯堆砌资源成本高,也无必要,自动扩容往往也来不及。...ModernFlux应用效果 下图是部分ModernFlux应用于营销活动效果图,黄色线表示实际通过流量,黑色线表示被拒绝的流量,蓝色线表示上游的真实流量绿色表示整个Set流量控制(未触发): ?
自动驾驶(Autopilot):数据库根据业务负载自动启动停止,无感扩缩容,扩缩容过程不会断开连接。...以双11高负载的场景为例,提前发起扩缩容的操作会导致运维效益随之大打折扣。不仅如此,固定规格对传统云数据库的计算进程常驻,无请求时仍然收费。...3.秒级扩缩容能力。(1). 通过计算与存储解耦,存储空间可以自动扩缩容,弹性能力显著。(2). 存储容量可以自动扩充,且容量足够大,足以支撑业务的发展。4.秒级快照备份回档能力。(1)....随着业务的增长,能够进行水平扩容,扩缩容的整体响应好。...自动扩缩容:不需要开发者提前去预测扩容的实例规格,通过系统的负载来进行自动的扩容。购买的时候,给用户提供一个区间,比如选择的是1核2G, 2核4G,就会只在这个固定的区间范围内进行扩缩容。
按量计费,自动扩缩 那么,为什么使用云开发的成本能降到这么低呢?团队一致认为应该归功于云开发的自动扩缩容。 在接触云开发之前,服务器费用对于一家初创企业来说一直是一项大支出。...,而云开发的按量付费和自动扩缩容机制就完美地解决了初创企业的服务器成本问题”。...这时,小程序云开发的云函数自动扩容机制就发挥作用了,快速反应扩容来应对大流量,让这次推广活动顺利完成,活动结束后,访问量也逐步恢复平日水平,这时候自动缩容机制又开始启动了,关闭闲置的云函数资源,减少服务器成本...另外,为了保证“11·11”活动的平稳运行,团队做了双重保障,一是提交工单,请云开发团队的工程师提前预热云函数,另一方面是将活动的时间拉长,尽可能把流量分摊开,不集中在某个时间点。...在此基础上,“11·11”活动中业务小程序运行得非常稳定,平台的商品也纷纷售罄。
自动化 节点池自动扩缩容依赖 Cluster Autoscaler 实现, 可与 HPA 无缝联动,实现从应用扩缩容到集群扩缩容的平滑过渡。...节点池能够在容器不够资源分配的情况下按需扩容 能够监控节点的 CPU、内存,自动缩容闲置节点 节点池提供两种扩缩容模式供您按需选择。...您可追踪节点池关联的扩缩容活动 (活动相关的触发条件、时间、涉及实例、成功/失败原因),同时您还可以通过事件持久化能力查看 Cluster Autoscaler 相关的集群级别扩缩容记录。...易用性 节点池提供多种扩缩容以及节点管理相关的灵活配置,您可以根据业务性质以及安全考虑自行搭配使用。 支持为节点设置缩容保护 您可以标记重要业务节点,标记后节点不会在缩容时被释放。...支持灵活的扩缩容参数配置 您可以配置灵活的扩缩容参数,本文将在下一节-扩缩容原理中详细展开。 集群扩缩容原理 弹性扩容原理 ?
扩缩容方面,我们主要通过垂直扩缩容的方式解决Redis集群容量的问题,但随着集群规模扩大,这种方式逐渐遇到了瓶颈。...垂直扩缩容对于Redis来说只是Maxmemory的配置更改,对业务透明; 第二,水平拆分/扩缩容的实现难度和成本较高。...三、Redis水平扩缩容 3.1 设计思路 ? 图4 既然缩分片比较困难,我们首先想到的是业务双写集群的方法,也就是业务同时双写2个新老集群,新老集群的分片数是不一样的,并且大小配置也不一样。...借鉴业务双写集群的思路和云原生的不可变基础设施的理念,我们首先想到的是通过新集群替换老集群而不是原地修改集群;另外,为了在公有云上节省Redis成本,我们积累了kvrocks的实践经验,两者相结合,设计了一种高效的水平扩缩容的方案...根据实际的运维数据来看,集群单个实例为20G,集群扩缩容在10分钟之内完成,而低于10G的,5分钟即可完成,大大缩短了扩缩容的周期,并且业务在毫无感知的情况下即可完成扩缩容。
,导致本次双节活动产生不小的业务损失。...环境说明环境模拟说明,这里采用云产品资源规格如下:服务器规格:标准型S5.MEDIUM2云数据库: MySQL8.0,通用型-1核 2G,双节点负载均衡: 公网CLB弹性伸缩:启动配置选择S5.MEDIUM2...配置告警触发策略这里为了快速看到效果,配置弹性扩容策略,CPU利用率设置为1分钟图片配置告警触发策略,弹性缩容图片3. 验证3.1....图片3.2 弹性扩缩容验证在进行压测的过程中, 可以在“伸缩活动”可以查看到,弹性扩缩容策略如期生效,能进行自动弹性扩容、缩容。图片4....总结本篇结合案例的痛点采用云产品进行业务弹性的改造,解决了在业务突增弹性扩容时效问题、低峰资源缩容节省成本的问题,同时结合多云产品的弹性业务构建方法,让用户更容易上手与参考。5.
简单认识 云原生有一个简单的理解:云指的就是云服务器,原生指的就是云服务器中自带的应用软件。...这些应用软件可以高效弹性扩缩容(指的就是增加或减少服务器的数量)后,自动适配新的服务器数量环境,而不需要运维或开发做什么。...那么双11的到来了,这些服务器肯定不够用,那么怎么安排才能满足双11的需求呢?...那么可以把双11活动分解成: 活动前:双11前引导用户浏览商品,并把商品添加到购物车 活动中:双11开始,引导用户直接从购物车下单购买 按照上述分解之后,活动前的访问压力就集中到商品浏览、商品购物车模块...反之活动中,购物车和支付模块的压力变大,我们可以同样把商品浏览模块的一半服务器分配给购物车和支付模块使用。通过以上的合理调配,你会发现我们没有增加新服务器,也能应对高并发。
不久前,腾讯云发布了国内第一款无服务器数据库ServerlessDB,受到众多数据库开发者的关注,关于该数据库的自动扩缩容能力以及背后的设计原理展开了激烈的探讨。...PartⅠ 真正实现自动扩缩容的挑战 相比较于传统数据库,云数据库的弹性扩缩容和按量计费能够帮助用户按需使用云资源,避免资源浪费的同时大幅节省了成本。...当用户访问请求上涨时,数据库针对用户请求的特点使用不同的系统资源,而这些资源需要动态的响应,且不会受到服务器限制。不同资源的扩缩容粒度需要小到一个数据块——CPU核心。...腾讯云ServerlessDB采用租户隔离扩缩容以及连接池管理技术,从而实现了技术层面上真正的弹性扩缩容。 1....快速扩缩容能力 在租户隔离技术避免了不同租户之间的访问越界问题后,在扩缩容方面,ServerlessDB是如何保证对用户进行细粒度控制的呢?
定时弹性:大促期间,设置开始和结束时间,自动弹性扩缩容,不用人工干预,提高效率。 节约成本:通过使用 HPA,您可以根据应用程序的负载需求自动调整 Pod 的副本数量。...原生 HPA 的不足 使用率计算基于 resources.requests 不支持定时扩缩容 4....desiredReplicas: "10" 4.1.2 前端设计 支持三个周期 按天 按星期 自定义 Cron 表达式 img img img 4.1.3 消息通知模版 定时HPA动态扩缩容提醒...2023-11-13 12:35:16 如有疑问可参考:HPA使用文档,或咨询@SRE客服 4.2 基于资源的弹性 根据 cpu、mem 等资源使用率,自动扩缩容,低负载缩容,减小不必要资源占用,高负载自动扩容...缩容时间 稳定窗口的时间为 300 秒,满足缩容条件后,连续5分钟持续满足缩容条件,触发缩容 4.5 建立可观测性大盘 后续补充 4.6 注意事项(优雅上下线) 自动扩容大多数是在高并发大流量情况触发,
定时弹性:大促期间,设置开始和结束时间,自动弹性扩缩容,不用人工干预,提高效率。节约成本:通过使用 HPA,您可以根据应用程序的负载需求自动调整 Pod 的副本数量。...原生 HPA 的不足使用率计算基于 resources.requests不支持定时扩缩容4....end: 45 * * * * desiredReplicas: "10"4.1.2 前端设计支持三个周期按天按星期自定义 Cron 表达式4.1.3 消息通知模版定时HPA动态扩缩容提醒...-13 12:35:16如有疑问可参考:HPA使用文档,或咨询@SRE客服4.2 基于资源的弹性根据 cpu、mem 等资源使用率,自动扩缩容,低负载缩容,减小不必要资源占用,高负载自动扩容,保证应用有足够的资源使用...缩容时间稳定窗口的时间为 300 秒,满足缩容条件后,连续5分钟持续满足缩容条件,触发缩容4.5 建立可观测性大盘后续补充4.6 注意事项(优雅上下线)自动扩容大多数是在高并发大流量情况触发,此时如果没有对应的解决方案
领取专属 10元无门槛券
手把手带您无忧上云