我之前在一家游戏公司,经历过单节点过载引发的全站崩溃,也处理过跨机房流量不均导致的区域性故障。
真正的负载均衡不是简单配置Nginx,而是构建全局流量调度中枢。
这篇文章跟大家一起聊聊负载均衡底层原理和常见问题,希望对你会有所帮助。
点击这里获取:100万QPS短链系统、商城微服务、苏三AI项目、秒杀系统、商城系统、秒杀系统、代码生成工具等 7 个项目的 源代码、开发教程和技术答疑
各层核心作用:
实现原理:
public class RoundRobinLoadBalancer {
privatefinal List<String> endpoints;
privatefinal AtomicInteger counter = new AtomicInteger(0);
public String next() {
int index = counter.getAndIncrement() % endpoints.size();
if (index < 0) {
counter.set(0);
index = 0;
}
return endpoints.get(index);
}
}
致命缺陷:未考虑服务器性能差异 → 低配服务器先过载
动态权重配置:
Nginx配置示例:
upstream backend {
server 192.168.1.10 weight=3; # 30%流量
server 192.168.1.11 weight=7; # 70%流量
server 192.168.1.12 backup; # 备用节点
}
核心思想:将新请求分配给当前连接数最少的服务器
Java实现:
public String leastConnections() {
return endpoints.stream()
.min(Comparator.comparingInt(this::getActiveConnections))
.orElseThrow();
}
// 模拟获取连接数(真实场景从监控获取)
private int getActiveConnections(String endpoint) {
return connectionStats.getOrDefault(endpoint, 0);
}
解决痛点:分布式缓存扩容时大量缓存失效
虚拟节点实现:
public class ConsistentHash {
privatefinal SortedMap<Integer, String> circle = new TreeMap<>();
privatefinalint virtualNodes;
public void addNode(String node) {
for (int i = 0; i < virtualNodes; i++) {
String vNode = node + "#" + i;
int hash = hash(vNode);
circle.put(hash, node);
}
}
public String getNode(String key) {
if (circle.isEmpty()) returnnull;
int hash = hash(key);
SortedMap<Integer, String> tailMap = circle.tailMap(hash);
int nodeHash = tailMap.isEmpty() ? circle.firstKey() : tailMap.firstKey();
return circle.get(nodeHash);
}
}
动态预测模型:
关键指标:
# 使用简单线性回归预测
def predict_load(historical):
# 输入: [(time, cpu, mem, conns)]
X = [t[0] for t in historical]
y = [t[1] * 0.6 + t[2] * 0.3 + t[3] * 0.1 for t in historical]
model = LinearRegression().fit(X, y)
return model.predict([[next_time]])
故障切换策略:
server 192.168.1.10 max_fails=3 fail_timeout=30s;
@HystrixCommand(fallbackMethod = "defaultResult")
public String service() { /* ... */ }
场景:某热点Key失效导致流量直击数据库
解决方案:
// 使用Google Guava缓存空值
LoadingCache<String, Object> cache = CacheBuilder.newBuilder()
.maximumSize(1000)
.expireAfterWrite(30, TimeUnit.SECONDS)
.build(new CacheLoader<>() {
public Object load(String key) {
Object value = db.query(key);
return value != null ? value : NULL_OBJ; // 空对象占位
}
});
现象:长连接导致流量倾斜
解决方案:
# Nginx配置短连接
upstream backend {
server 192.168.1.10;
keepalive 50; # 每worker最大连接数
keepalive_timeout 60s;
}
案例:北京调用上海服务频繁超时
优化方案:
feign:
client:
config:
default:
connectTimeout: 500
readTimeout: 1000
// 上海服务不可用时使用本地缓存
@Fallback(fallbackClass = LocalCacheService.class)
public interface RemoteService {}
public class HealthChecker implements Runnable {
privatefinal List<ServerNode> nodes;
public void run() {
for (ServerNode node : nodes) {
boolean alive = checkNode(node);
node.setAlive(alive);
}
}
private boolean checkNode(ServerNode node) {
try (Socket socket = new Socket()) {
socket.connect(new InetSocketAddress(node.getIp(), node.getPort()), 500);
returntrue;
} catch (IOException e) {
returnfalse;
}
}
}
三层设计原则:
五大核心原则:
负载均衡的本质不是平均分配流量,而是让合适的请求到达合适的节点。
当你能从流量调度中看到业务特征,从算法选择中预见系统瓶颈,才算真正掌握了高并发架构的精髓。
最后欢迎加入苏三的星球,你将获得:100万QPS短链系统、复杂的商城微服务系统、苏三AI项目、刷题吧小程序、秒杀系统、商城系统、秒杀系统、代码生成工具等8个项目的源代码、开发教程和技术答疑。