我们在规划、建造和运营数据中心的过程中,很容易犯以下几个错误:
1. 数据中心的可用性被放大
我们常常听到说某某数据中心实现了四个九、五个九甚至六个九,我来来看看这么多的九意味着什么:
数据中心可用性
从上面的表中我们可以看出,当可用性为五个九(99.999%)的时候,就意味着整个数据中要保证全年的故障时间在315.36秒以内,也就是5.256分种,如果我们的数据中心设计寿命为15年的话,那么数据中心整个生命周期的故障时间要控制在78.84分种,也就是1.314个小时。如果可用性为六个九,那么就要求数据中心的故障时间还要缩小一个数量级。
我们知道,数据中心整体的可用性是由数据中心的各个子系统的可用性决定的,要使数据中心的整体可用性达到“五个九”那么数据中心的各个子系统的可用性要求将远远大于“五个九”。
因此,在规划和建设数据中心时一味强调“五个九”甚至“十个九”是不现实的。
2. 对数据中心供电关注不够
我们在规划、建造和运营数据中心的过程中,常常把一个最致命的问题给忽略了,这个致命的问题就是供电问题。首先我们不够关注到达数据中心的两路市电是否为真正的两路市电,例如仅仅从同一配电站拉了两根电线到数据中心的就不叫两路市电,真正的两路市电是由处在城市中两个不同地理位置的变电站通过不同的供电管道从大楼的不同方向进入数据中心的才能叫两路市电。然后是许多数据中心未足额配备发电机,发电机是完全自主控制且不受外界影响的紧急供电电源,在自然灾害和重大事件中,完全隔离的两路市电也代替不了备用发电机。
3. 数据中心容错理解错误
许多数据中心的运营者认为,数据中心有了冗余的UPS,就有了可以容错的数据中心,这是一个典型的理解错误。我们知道,在数据中心基础设施建设过程中,最先完成冗余的是UPS,而最容易忽略的是配电系统中缺少冗余,例如制冷设备有冗余,而制冷供电却没有。这些都是非常致命的。
4. 配备大量UPS电池来应付断电情况
许多数据中心使用单位都希望配备大量的UPS电池来应付断电情况,这样做是存在诸多问题的,一是电池的容量和备用时间有限的,而市电故障再恢复的时间是不固定的,所以电池最终不能解决系统供电问题,得从更加全面的考虑供电体系才行,例如使用后备发电机供电,这样只需要配备省量电池,以支撑到发电机工作,或是在发电机也无法工作的极端情况要,让系统管理员有时间启动停机程序。二是电池的重量和成本都是需要考虑的问题,大量的电池会给数据中心建筑的承重带来挑战,同时大量电池的更换成本也不容小视。三是通常电池无法为制冷系统供电,在一些高密度机架如果没有制冷系统工作,那么设备最长工作时间可能只有几分种,就会因为温度过高而停机。
领取专属 10元无门槛券
私享最新 技术干货