高可用 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签高可用

#高可用

高可用之路·观测篇-指标失明

无毁的湖光-Al 4天前2026-07-27 15:59:48

紧接上篇<<高可用之路-闲聊监控指标的局限>>。上篇说到，指标只是事实的投影，由于代价的存在它无法无限的逼近真实。因此，指标自身的局限有时不仅无法帮助我们发现问...

7100

机房着火、光缆挖断、硬盘暴毙：一套云系统凭什么敢说"永远在线"？

了了同学 5天前2026-07-25 18:49:54

2021年3月，欧洲某头部云服务商在斯特拉斯堡的一个数据中心起了火，大火烧了整整一夜，多个机房瘫痪，上百万个网站一夜之间消失，连法国政府的部分线上服务都跟着挂了...

6600

运动品牌落地腾讯云：多云架构迁移实现年IT支出降26%与可用性99.99%

IT资讯研究所

腾讯科技｜研究员 (已认证)

6天前2026-07-24 18:52:55

烈日信息作为运动品牌企业，为降低单云风险将阿里云存量架构迁移至腾讯云，依托腾讯云产品矩阵及合作伙伴概泽科技驻场支持完成多云部署，实现年IT支出降低26%、业务可...

10110

高可用与扩展：一台 PostgreSQL 不够用之后怎么办？

Lihua奏 7天前2026-07-23 21:28:36

如果只用一句话理解高可用与扩展，那就是：复制是在给数据库准备副本和读能力，分区是在管理超大的表，连接池是在控制连接带来的资源消耗。

12510

同城双活容灾切换：机房断电场景下脑裂保护、VIP漂移与DNS延迟的排查方案

数据库小学妹 9天前2026-07-22 10:24:33

凌晨两点十四分，手机把我震醒。来电显示是监控告警，接起来就听到机房值班同事的声音："机房A断电，UPS快撑不住了，你来看下监控。"我打开面板，第一反应是松了口气...

9410

10万日活的高可用Agent系统架构设计

架构师刀哥 10天前2026-07-21 09:40:12

如果是百万注册用户、10 万日活，要把 Agent 执行从 Web 进程中拆出来，采用持久化工作流 + 可水平扩展 Worker + 事件驱动架构。

12610

Kubernetes Ansible 部署生产级别高可用的集群

用户11081884 10天前2026-07-20 19:00:36

云原生环境中Kubernetes 已成为容器编排的事实标准。对于生产环境而言，高可用性是不可或缺的关键特性。本文将介绍如何使用 Ansible Playbook...

8800

Kubernetes Pod分配和调度策略

用户11081884 11天前2026-07-20 17:11:04

在Kubernetes中，调度器的核心功能是自动分配Pod到合适节点，但通过以下高级特性可精细化控制调度逻辑，满足复杂场景需求：

9510

企业网络监控系统为什么必须具备高可用（HA）能力？

运维行者 15天前2026-07-16 09:49:03

在企业数字化转型不断加速的背景下，网络监控系统已经成为 IT 运维的"可见性中心"——运维人员依赖它实时掌握网络设备、服务器、应用服务和流量等关键指标的运行状态...

10110

MHA退场，Orchestrator接棒：Debian 13 + MySQL 8.0高可用迁移全记录

悠悠12138 16天前2026-07-14 18:56:46

"BackendDB": "sqlite"：用SQLite存元数据，单机够用了。如果Orchestrator要做高可用，那就得用MySQL后端。

25610

MySQL高可用架构选型：从故障切换耗时到数据一致性，三种方案实测对比

数据库小学妹 23天前2026-07-08 10:24:45

那天之后，我花两周把MHA、MGR、InnoDB Cluster都搭了一遍。今天把完整对比写出来。

21110

KES技术深挖：内核原理、高可用方案与迁移实战

数据库小学妹 25天前2026-07-06 14:51:08

2025年信创政策全面铺开，很多技术团队接到的第一个任务就是：把Oracle换成国产数据库。选型会上领导问"KES行不行"，你能答得上来吗？

19010

大状态 Flink 作业 Checkpoint 稳定性治理实践

用户11058296 26天前2026-07-05 17:33:35

结论:这不是一次单点参数调优,而是一次大状态实时作业稳定性治理。某实时特征作业负责消费用户行为事件,按用户维度聚合多时间窗口状态,并把结果写入在线 KV 存储,...

24720

高可用之路-监控指标无法突破采集环境的边界

无毁的湖光-Al 28天前2026-07-02 18:29:03

如果我拥有无限的精度能否精确的反映系统的运行过程呢？有时候也不能做到，因为指标是在环境中采集的，环境本身限制了它的表达。例如在容器中cpu busy的计算是 :

9910

#高可用

高可用之路·观测篇-指标失明

机房着火、光缆挖断、硬盘暴毙：一套云系统凭什么敢说"永远在线"？

运动品牌落地腾讯云：多云架构迁移实现年IT支出降26%与可用性99.99%

高可用与扩展：一台 PostgreSQL 不够用之后怎么办？

同城双活容灾切换：机房断电场景下脑裂保护、VIP漂移与DNS延迟的排查方案

10万日活的高可用Agent系统架构设计

Kubernetes Ansible 部署生产级别高可用的集群

Kubernetes Pod分配和调度策略

企业网络监控系统为什么必须具备高可用（HA）能力？

MHA退场，Orchestrator接棒：Debian 13 + MySQL 8.0高可用迁移全记录

MySQL高可用架构选型：从故障切换耗时到数据一致性，三种方案实测对比

KES技术深挖：内核原理、高可用方案与迁移实战

大状态 Flink 作业 Checkpoint 稳定性治理实践

高可用之路-监控指标无法突破采集环境的边界

热门专栏

腾讯云中间件的专栏

腾讯云 DNSPod 团队

腾讯云数据库(TencentDB)

Java技术分享

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐