在分布式架构中,前端一个请求会经过后端的多个服务的处理才返回结果,这时就可能会存在一种情况,在间歇性高负载情况下,某个服务 B 的处理能力不能满足负载的需求,从而导致服务 B 崩溃或者服务调用者 A 响应超时,如下图所示:
那么如何解决这种问题呢?有读者可能会说,那就给服务 B 作单机性能优化,从而提升单机处理能力,进而提升服务 B 集群的整体处理能力;或者当单机处理能力已经无法进一步优化或者即使优化后仍然无法满足负载需求时,那么就对服务 B 集群进行水平扩容,从而提升集群整体的处理能力。
没错,这是一种常见的解决方案,但如果服务 B 集群扩容成本很高呢?例如服务 B 需要用到 GPU 来跑 AI 模型,而我们知道 GPU 成本不低。有一种解决方案是通过引入消息队列(例如 Kafka,RabbitMQ 等)来作为缓冲区,从而最小化请求峰值对服务可用性和响应性的影响(当然,也要考虑具体业务场景是否适合使用这种方式),如下图所示:
引入消息队列后,原来的同步调用变为异步执行,服务 A 将原来的请求封装成消息,发送到消息队列中,而服务 B 则根据自己的处理节奏从消息队列中获取消息进行处理,消息队列起到缓冲区的作用。这样即使服务 A 集群对服务 B 集群发起大量的并发请求,也不会导致服务 B 集群处理不过来甚至崩溃。
当然这种模式也适用于进程内的流量削峰,我们只需把上面的服务 A 和服务 B 替换成同一个应用进程内的模块间调用,而消息队列则替换成进程内的队列实现方案(例如 Disruptor)即可,模式是活的,具体如何应用就看使用者的水平了。
对Java技术,架构技术感兴趣的同学,欢迎加QQ群:863621962,一起学习,相互讨论。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。