腾讯游戏服务器引擎(Game Server Engine,缩写GSE),支持有状态的游戏服务部署和扩缩容,实现服务发现、高效灵活的服务器伸缩和就近调度的能力,帮助开发者快速构建稳定、低延时的多人游戏的部署环境...这是一个有状态的扩缩容场景:对于游戏服务,尤其是对战服务来说,不能是简单添加一个clb(负载均衡)就能搞定。在游戏服务里需要断线重连,能找到之前连接的服务器;另外游戏过程不能因为缩容中断游戏。...成本节约 服务器空闲导致的成本,如以下这些情况: · 每日&周末&节假日的高峰波谷 · 游戏稳定运营及下降期,服务器空闲资源 · 活动期间,爆发增长,活动过后需资源空闲 比起游戏运营成本来说,服务器成本算不了什么...游戏服务器引擎(Game Server Engine,缩写GSE)提供专用游戏的服务器托管服务,支持有状态的游戏服务部署和扩缩容,实现服务发现、高效灵活的服务器伸缩和就近调度的能力,帮助开发者快速构建稳定...不需要提前在多个区域部署相同数量的服务器,从而达到0成本容灾的效果。 9.png 4. GSE和普通弹性伸缩的区别——GSE专注于有状态扩缩容场景 游戏中有两个特殊需求:断线重连、游戏中不能退出。
,活动之间相互割裂,缺乏沉淀复用和共享 运营活动快上快下的特点非常适合跑在 TKE 环境,利用其弹性伸缩、快速扩缩容特性应对活动突发流量。...自动扩缩容,极大的提升了周期性游戏活动资源准备效率。...网关运营监控指标 业务容器性能监控指标 官网营销活动 官网营销活动HPA实践 业务需求场景:营销活动有定点开启特性,开启时流量会突增,且生命周期内流量波动较大,对资源有弹性扩缩容需求。...需求 最终效果 分钟级扩容 优化后的 HPA 直接从 Metrics Server 取负载数据,扩容可以做到1分钟左右 原生 HPA 仅支持 Pod 粒度的 metric 计算,需要针对业务容器进行扩缩容...container 时业务容器负载高,但是 Pod 整体负载低情况下可以扩容 支持 request、limit 多种方式触发 HPA 支持按 request、limit 的方式 HPA,覆盖不同的业务场景 扩缩容事件
通过云上的容器化部署、自动扩缩容、健康检查、可观测性等手段,提高了知几项目的持续交付能力和稳定性,形成了一套适合游戏知几自身的上云实践方案。...,需要发布最新版本才能扩容; 依赖的权限(mysql 等)需要申请; 平台操作繁琐,容易出错; 需要人工完成运营活动后机器的缩容操作。...基于上述的部署方案,利用云原生的自动扩缩容能力可以方便地解决上述问题: STKE 提供的定时 HPA 和动态扩缩容能力,可以很好的解决节假日、运营活动的流量突增带来的服务稳定性问题,且流量平稳后的自动缩容可以有效的节约资源...由于 HPA 会导致业务容器的扩缩容,如果流量在服务未完成启动时接入或者流量还在访问时接销毁 pod,会导致流量的损失,因此需要开启就绪检测和 prestop 配置。...特别是定时 HPA,可以很方便的满足知几在未成年人保护方面对扩缩容的要求,系统可以在特定时间段完成系统容量的扩容和缩容,在保证系统平稳应对流量的同时也不会造成对资源的浪费。
扩缩容方面,我们主要通过垂直扩缩容的方式解决Redis集群容量的问题,但随着集群规模扩大,这种方式逐渐遇到了瓶颈。...垂直扩缩容对于Redis来说只是Maxmemory的配置更改,对业务透明; 第二,水平拆分/扩缩容的实现难度和成本较高。...三、Redis水平扩缩容 3.1 设计思路 ? 图4 既然缩分片比较困难,我们首先想到的是业务双写集群的方法,也就是业务同时双写2个新老集群,新老集群的分片数是不一样的,并且大小配置也不一样。...借鉴业务双写集群的思路和云原生的不可变基础设施的理念,我们首先想到的是通过新集群替换老集群而不是原地修改集群;另外,为了在公有云上节省Redis成本,我们积累了kvrocks的实践经验,两者相结合,设计了一种高效的水平扩缩容的方案...根据实际的运维数据来看,集群单个实例为20G,集群扩缩容在10分钟之内完成,而低于10G的,5分钟即可完成,大大缩短了扩缩容的周期,并且业务在毫无感知的情况下即可完成扩缩容。
自动化扩缩容的目的主要有三个部分,首先是用户体验的保障,我们必须以最快的响应速度去应对用户增长的需求,否则必然会出现大规模的掉线或者拥挤排队,影响游戏基本体验;其次是资源的最有效利用,英雄联盟业务的单位运营成本...关于自动化扩缩容利器的用户交互,主要用的是类似汽车的仪表盘的形式来展示相关扩缩容时实施人员比较关心的数据。如图(2) ?...所向披靡-无所不能的容量云: 二期功能加入了监控和自动触发、缩容等功能,真正实现采集性能数据、按照模型分析出结论、实施扩缩容、性能数据达标等一系列操作,流程上把容量管理这件事做成闭环。...自动采集数据、分析出决策、实施扩缩容操作的整体流程架构图如下: ?...才将云中的服务器扩到游戏大区中;如红色的箭头所示,通过自动化的缩容,我们做到了自动化的将游戏大区中,尚且富余的服务器资源返还给业务云,然后由云在分配给需要使用的游戏大区,这样通过自动化的扩、缩容服务,我们做到了服务器资源自动化的动态调用
3.现网变更频繁,前端版本、后端版本发布,系统配置调整、营销活动规则调整等各种变更每天加起来平均300+次,大家都知道,变更带来的故障通常占到了现网故障的75%以上,所以在这么变更频发的平台上进行营销活动资源扩缩容...在这里的自动化扩缩容设计里,现网大盘由服务组成,服务由系统实例组成,而实例承载的基础是腾讯计费自研的TDF程序框架;扩缩容的核心大脑就是TSM自动化管理平台,压测平台周期性压测现网容量,现网内存、负载、...这里采用KVM虚拟机构建用于自动扩缩容的资源池,共享资源池会在日常扩容中出库消耗,在缩容中退库,这样持续的循环。...以上介绍了自动化决策和自动化扩缩容的机制,那么是不是有了这些自动化机制就万无一失了呢?...一是大盘容量的压测机制,二是快速扩缩容机制,以及资源共享管理、变更扫描,和限频保护措施。 构建之后,自动化保障体系可以浓缩为如下示意图。
3.现网变更频繁,前端版本、后端版本发布,系统配置调整、营销活动规则调整等各种变更每天加起来平均350+次,大家都知道,变更带来的故障通常占到了现网故障的75%以上,所以在这么变更频发的平台上进行营销活动资源扩缩容...在这里的自动化扩缩容设计里,现网大盘由服务组成,服务由系统实例组成,而实例承载的基础是腾讯计费自研的TDF程序框架;扩缩容的核心大脑就是TSM自动化管理平台,压测平台周期性压测现网容量,现网内存、负载、...这里采用KVM虚拟机构建用于自动扩缩容的资源池,共享资源池会在日常扩容中出库消耗,在缩容中退库,这样持续的循环。...如何确保扩缩容变更精准无误 一开始有提到,在日常频繁变更的现网大盘上进行扩缩容操作,故障风险是非常高的,那么怎么确保这里的变更准确性呢?也就是怎么确保扩容上去的资源服务没有问题。...如何防止大盘雪崩风险 以上介绍了自动化决策和自动化扩缩容的机制,那么是不是有了这些自动化机制就万无一失了呢?
TDSQL-C Serverless 的技术实现 传统云数据库并没有实现自动扩缩容、按使用量计费、无使用无费用。...在现实里,如果游戏厅就在你房间旁边,你房租的价格也会比其他地方的更贵。 计算跟存储分离,就是让房子和客厅解耦。只要解决传送问题(自动扩缩容)就可以让这个房间的成本回归到它本身的价值。...常见的自动扩缩容业务场景 慢查询。...当然你也可以选择在活动前扩容,活动后缩容。但这总的也不方便,而且并不是所有的活动都有足够的时间去规划。所以这时候就需要一个自动扩缩容的能力。 定时任务。很多业务都会有定时任务的需求。...虽然你也可以根据计划去手动扩缩容。但有些计划使用的计算资源不可控,时间也不可控。少了速度慢,可能还会影响到线上业务,多了又会浪费。
在现实里,如果游戏厅就在你房间旁边,你房租的价格也会比其他地方的更贵。 计算跟存储分离,就是让房子和客厅解耦。只要解决传送问题(自动扩缩容)就可以让这个房间的成本回归到它本身的价值。...TDSQL-C Serverless 数据库特点 自动扩缩容 按使用量计费 无使用无费用 我们希望你想要请求的时候,这个水资源能像瀑布一样倾泻而下,不需要业务提前感知。...当然你也可以选择在活动前扩容,活动后缩容。但这总的也不方便,而且并不是所有的活动都有足够的时间去规划。所以这时候就需要一个自动扩缩容的能力。 定时任务 很多业务都会有定时任务的需求。...虽然你也可以根据计划去手动扩缩容。但有些计划使用的计算资源不可控,时间也不可控。少了速度慢,可能还会影响到线上业务,多了话又是浪费。...用户数激增:自动扩缩容。 小微项目:小规格实例 …… 目前我们做到了很多,未来我们还有很多可以去做。
背景 对于FPS[2]、MOBA[3]等在线多人游戏后台架构中,都有专门服务玩家对局的服务器Dedicated Server(简称 DS)[4]。 下图是典型的游戏 DS 架构: ?...比如很多游戏业务都希望实现定时扩缩容,甚至应用自己控制 Workload 副本数量。 业界已经有一些开源项目去尝试解决这类游戏服务的 DS 管理问题,比如 Google 的Agones[8]。 ?...Squad 和 GeneralPodAutoscaler 提供了一些扩展和交互机制,变更,或者扩缩容时,GameServer 可以更加优雅的退出,避免对游戏玩家的影响。...应用定义缩容顺序 缩容时,可由应用指定缩容的顺序。例如,缩容时,应用可以选择玩家数量的 DS 副本删除。这不仅可以降低缩容开销,还可以提高底层的资源利用效率。...更好的与集群扩缩容(CA)工作 基于应用确认机制,缩容时,CA 可以选择任意的副本进行删除,不用担心对用户的影响。 基于 OCGI 的游戏后台架构 ?
OTO 服务通过基于 Kubernetes 的 GDP(游戏微服务开发平台),可以快速部署、自动扩缩容和资源回收复用。...再配合 K8s 的 HPA 即可自动根据后端性能指标扩缩容,极大提升资源利用率。 Pulsar 还支持对单个消息独立 Ack,可以很好地防止重复消费。...这样所有服务都在云端通过 K8s 调度,有高可用保障,只需调整副本数即可轻松扩缩容。 基于事件总线的事件分发 事件总线用于规范事件管理,事件按业务和类型维度管理。...K8s 支持 HPA,通过监控容器 CPU 和其他内存指标,当达到一定阈值时,触发服务扩缩容。这对一些队列消费服务不适用。...我们计划扩展 K8s 的 HPA,在监控 CPU 和内存等指标基础上再监控 msgBacklog,增强扩缩容灵活性,防止消息堆积。
应用于腾讯IEG 80%的营销活动以及多个内部平台。经历各种秒杀活动、游戏周年庆以及节假日,取得很好实践效果,保障了系统安全运营。现将ModernFlux对外开源,为微服务开源社区贡献力量。...数据传输具有容错机制,流控服务具有健壮性并有容灾机制。 ...2.业务扩缩容对负载保护系统无感知,即系统对业务扩缩容透明。 3.在保证流控精度前提下,对业务流量(剧烈)变化不敏感,无需频繁扩缩容。...应用场景有营销活动(如秒杀/周年庆),电商大促,多业务混布虚拟隔离。 大型游戏秒杀营销活动入口流量难以预估,由于流量瞬间暴增和营销资源有限,单纯堆砌资源成本高,也无必要,自动扩容往往也来不及。...ModernFlux应用效果 下图是部分ModernFlux应用于营销活动效果图,黄色线表示实际通过流量,黑色线表示被拒绝的流量,蓝色线表示上游的真实流量绿色表示整个Set流量控制(未触发): ?
不久前,腾讯云发布了国内第一款无服务器数据库ServerlessDB,受到众多数据库开发者的关注,关于该数据库的自动扩缩容能力以及背后的设计原理展开了激烈的探讨。...PartⅠ 真正实现自动扩缩容的挑战 相比较于传统数据库,云数据库的弹性扩缩容和按量计费能够帮助用户按需使用云资源,避免资源浪费的同时大幅节省了成本。...当用户访问请求上涨时,数据库针对用户请求的特点使用不同的系统资源,而这些资源需要动态的响应,且不会受到服务器限制。不同资源的扩缩容粒度需要小到一个数据块——CPU核心。...腾讯云ServerlessDB采用租户隔离扩缩容以及连接池管理技术,从而实现了技术层面上真正的弹性扩缩容。 1....快速扩缩容能力 在租户隔离技术避免了不同租户之间的访问越界问题后,在扩缩容方面,ServerlessDB是如何保证对用户进行细粒度控制的呢?
自动驾驶(Autopilot):数据库根据业务负载自动启动停止,无感扩缩容,扩缩容过程不会断开连接。...以双11高负载的场景为例,提前发起扩缩容的操作会导致运维效益随之大打折扣。不仅如此,固定规格对传统云数据库的计算进程常驻,无请求时仍然收费。...3.秒级扩缩容能力。(1). 通过计算与存储解耦,存储空间可以自动扩缩容,弹性能力显著。(2). 存储容量可以自动扩充,且容量足够大,足以支撑业务的发展。4.秒级快照备份回档能力。(1)....随着业务的增长,能够进行水平扩容,扩缩容的整体响应好。...自动扩缩容:不需要开发者提前去预测扩容的实例规格,通过系统的负载来进行自动的扩容。购买的时候,给用户提供一个区间,比如选择的是1核2G, 2核4G,就会只在这个固定的区间范围内进行扩缩容。
自动化 节点池自动扩缩容依赖 Cluster Autoscaler 实现, 可与 HPA 无缝联动,实现从应用扩缩容到集群扩缩容的平滑过渡。...节点池能够在容器不够资源分配的情况下按需扩容 能够监控节点的 CPU、内存,自动缩容闲置节点 节点池提供两种扩缩容模式供您按需选择。...您可追踪节点池关联的扩缩容活动 (活动相关的触发条件、时间、涉及实例、成功/失败原因),同时您还可以通过事件持久化能力查看 Cluster Autoscaler 相关的集群级别扩缩容记录。...易用性 节点池提供多种扩缩容以及节点管理相关的灵活配置,您可以根据业务性质以及安全考虑自行搭配使用。 支持为节点设置缩容保护 您可以标记重要业务节点,标记后节点不会在缩容时被释放。...支持灵活的扩缩容参数配置 您可以配置灵活的扩缩容参数,本文将在下一节-扩缩容原理中详细展开。 集群扩缩容原理 弹性扩容原理 ?
该平台做了很多简单的整改,我们发现很多开发者其实对购买服务器搭建数据库、初始化、扩缩容等,并不熟悉,包括CDN他们也不太明白。...前面的轻量级游戏解决方案无法适用于重度游戏,所以我们总结了些重度小游戏在架构方面面临的一些挑战。 首先是弹性扩缩容,这也是目前最令运维最头痛的问题,因为我们无法预测到小程序何时会爆。...有时候某个大V不经意的在朋友圈或者群里发了这个游戏,可能就会引发几何式的增长。 而此时游戏又没有办法做弹性扩容,因为可能架构上就不满足弹性扩缩容的要求。...所以我们经常会看到,要么游戏一直不火,要么火了一段时间后停机维护,之后淡出视线。 第二个是高并发承载,这也是实现弹性扩缩容的先决条件,即如何应对突发的大流量涌入,在高压情况下保证游戏的流畅性。...弹性扩容主要是通过腾讯云的云监控获取服务器、CPU、内存、读写的承载情况,然后判断这些数据是否达到阈值,一旦超过阈值就自动进行扩缩容。
,但很多人误认为serverless只是计算的演进,但其实Serverless不单指计算,一般来说Serverless = FaaS + BaaS,既有计算能力的提供,也由后端能力的提供,泛指可以弹性扩缩容...典型的Serverless服务的例子: 云函数 Cloud Function API ⽹关 API Gateway 对象存储 Object Storage 都支持弹性扩缩容、按需付费。...弹性扩缩容,轻松应对突增流量。使得资源利用率得到提升。 关注业务代码,减少运维复杂度。这使得开发者的效率得到提高。...右下角的图,展示了在传统的模式下,搭建企业级架构是需要考虑很多方面的,如运维数据库、分配服务器、集群扩缩容、安全、网络等。对于开发者而言,这很多是没必要的,只需关注自身的业务逻辑。...客户⽅案: 所有⽆状态的HTTP接⼝,⽐如客服消息接收、⽀付回调均迁移到 Serverless 架构上 ⽆需返回的异步任务,⽐如游戏⾥的上报玩家排名 定时任务,⽐如定期对玩家推送相应的活动信息 客户价值
并具备以下特性: 省钱:云托管没有流量可缩容到 0;存储按实际存储容量计费。无需为闲时资源买单。按量付费,无需预先支出。...省心:Serverless 无服务器化,架构弹性可自动扩缩容,无需担心网站崩溃。 更快:用户发帖上传的图片与附件,享受 CDN 节点就近加速分发。...各项资源都将按使用量计费,如果站点一直无流量访问,云托管将于半小时内缩容到0,若数据库使用的是 Serverless 模式,随后数据库用量也会降为0。...但这种计费模式以及云开发自动扩缩容的特性,无论对访问量低的个人尝鲜还是流量波动大的业务活动推广,都带来更低成本、更省心的体验。 注:因为 Discuz!...产品介绍 云开发(Tencent CloudBase,TCB)是腾讯云提供的云原生一体化开发环境和工具平台,为开发者提供高可用、自动弹性扩缩的后端云服务,包含计算、存储、托管等serverless化能力
另外,对于底层架构来说,相比较于其他类型业务,游戏业务除去常规的业务高峰时间预估之外,很难做到业务爆发的时间准确判断,作为国民手游的王者荣耀也存在因各类突发事件和特殊时期带来的巨大流量,这对底层数据库自动扩缩容能力提出了巨大挑战...在这种访问模式下,游戏服务器操作平均响应时延小于4ms,存储层读写时延为微秒级。 ?...我们都知道,面对随时会出现的业务高峰和低谷,人力运维存在明显弊端,这就对系统的智能化能力提出了高要求,而高频的业务忽高忽低,导致伸和缩同时出现,会使得数据库无法处理请求,严重的还会导致数据库宕机,所以要实现系统智能根据业务情况进行自动扩缩容是非常困难的...四、接入层扩缩容是无损的,业务无感知 TcaplusDB自研了SDK,SDK内维护了接入层一致性hash环,天然支持增加或者减少接入层节点。...1 PartⅢ 结语 TcaplusDB是一款腾讯自研的高性能内存式分布式数据库系统,具有高性能、无损扩缩容、高可用、易用性等特性,针对游戏业务的开发、运营需求,支持全区全服、分区分服的业务模式,提供不停服扩缩容
接手飞车运维以来,在扩缩容上耗费了比较多的精力,于是有了我们今天的主题,飞车扩容改造。 扩容之殇 QQ飞车一年有4次大的活动节点,春节,五一,暑假,国庆。...活动的量级都是百万级别的,而由于成本和资源的限制,我们的机器不能长期保有在扩容期间的量级,因此,扩容缩容便成为了飞车运维工作中一项重要的工作。运维在活动前准备的时间相对比较长。...核心脚本的工作示例如 经过改造之后,我们的扩容,缩容,变更都可以通过这一套脚本来实现,扩缩容模版就可以变得更简单。...扩缩容生态建设 有了基础的脚本支撑,我们就依托于标准运维对之前的扩缩容“生态”工具进行改造,得益于D+的日趋成熟,飞车的镜像扩容模版也已经完成建设,镜像扩容省去了业务传包和一些初始化的工作,可以节约大部分的时间...通过扩缩容不断的验证工具的正确性,确保工具的万无一失; 2)效果评估。尤其是引入D+之后的镜像扩容,相比于传统的扩容在时间成本上能有多大的提升; 3)文档与版本建设。
领取专属 10元无门槛券
手把手带您无忧上云