我在测试我们的一个测试系统的弹性。我们将2xDB( Server 2008 R2 on Server 2008 R2,运行在ESXi VM中)安排在故障转移群集中。
关闭Active SQL Server服务不会做太多事情--服务不会重新启动,也不会发生故障转移;我认为这是设计好的--系统假设管理员有充分的理由关闭服务,所以会静静地坐着。
但是,我们可以通过多种方式模拟失败--我发现最简单的方法就是在Task中杀死SQL服务。我们的集群被设置为允许在6小时内发生一次故障,所以在第一次失败之后,它尝试重新启动服务--它成功了。第二次(在6小时内)关闭服务,集群管理器将决定将DB故障转移到被动服务
因此,我们正在运行一个由Apache2.2实现负载平衡的2+后端服务器集群(碰巧是JBoss服务器)。有时会发生后端服务器没有响应的情况(这意味着它们将等待很长时间才能回复请求,但不会立即关闭连接)。这自然会以502 "Bad gateway“错误结束。我对负载均衡器的理解是,它应该进行故障转移并将请求重定向到其余实例。
我已经看到,平衡器的一个节点可以进入错误状态,但永远不能强制将一个节点发送到该状态(即,在遇到第一个502之后执行此操作)。我是否遗漏了什么,或者这只是我所希望的一个特性?哦,这是我的配置:
<Proxy balancer://s>
Order d