
节前上线出问题,线上灰度发布后部分用户反馈付款后订单状态不更新,支付服务的失败率飙升。一顿排查后发现致命配置错误。小可爱上线时,将payment-service服务的 Nacos 注册类型改成了ephemeral=false(持久化实例)。
当时其中一台服务节点因内存泄漏频繁 GC,心跳线程被阻塞超过 30 秒,但是由于持久化实例没被 Nacos 剔除,导致调用方持续往这台异常节点发请求,最终拖垮整个支付链路。
这个面试场景题总问,不过很多同学对 Nacos 临时、持久实例的认知,只停留在服务会不会消失的表面,什么时候该用临时,什么时候该用持久,适用场景是什么,没太明白。
我们用 Nacos 主要使用到它的服务注册中心和配置中心,它们的设计初衷不同,服务注册中心要求符合 CAP 中的高可用(AP)服务发现不能中断,允许短暂数据不一致;注册中心要求是一致性(CP),配置不能错、不能丢,更新需同步到所有节点。
简单说,注册中心的实例是活的服务节点,配置中心的实例是死的配置文件。
它们之间的实例的概念也不太一样:
对比维度 | 服务注册中心的实例 | 配置中心的实例 |
|---|---|---|
本质 | 运行中的服务节点(如 | 静态配置数据单元(如 |
核心作用 | 提供服务发现,让调用方找到可用节点 | 集中管理配置,支持动态更新 |
创建方式 | 客户端自动注册(如 Spring Cloud 服务启动时) | 手动创建(控制台 / API)或代码推送 |
生命周期依赖 | 依赖服务节点的运行状态(节点宕机则实例失效) | 依赖手动维护(不删就一直存在) |
要知道服务注册中心的核心需求是实时感知服务可用性。
它设计了临时实例和持久化实例两种模式,分别对应动态服务和静态服务场景。
临时实例是 Nacos 服务注册的默认模式。
Spring Cloud、Dubbo 等业务服务启动时,若不额外配置,都会以临时实例注册。核心逻辑是心跳保活,来检测服务的可用性。
持久化实例则完全相反,它针对长期稳定运行、很少变化的基础服务(如 MySQL、Redis、Elasticsearch)设计,核心逻辑是服务端主动探活 + 数据持久化,不适合支付、订单这类动态业务服务。
在 SpringCloud 项目中,只需在application.yml中添加一行配置,就能切换实例类型,就是这行配置,被新人改错导致了故障:
spring:
cloud:
nacos:
discovery:
server-addr: 192.168.1.100:8848
ephemeral: false # 新人误改为此值,正确应为true(默认)
service: payment-service # 注册的服务名Nacos 配置中心的所有配置实例(即配置文件)默认都是持久化的,根本不存在临时配置的概念,所谓的动态更新也和临时无关。
Nacos 配置中心的设计初衷是集中管理配置,避免配置丢失,因此所有配置都满足以下特性:
说了一大堆其实总结起来就两句话:
读到这就等于学会!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。