导语
冷却水在制冷系统中起到十分重要的作用,是冷量传递的媒介。冷却水系统如果发生缺水现象,会产生严重的后果,轻则导致空调送风温度升高,重则导致冷机停机,甚至导致服务器宕机。为了保证数据中心安全平稳运行,腾讯某数据中心经过多年运营经验,采取报警+维保+巡检多管齐下,避免冷却水缺水现象的发生。
1.报警
冷却水系统出现缺水问题首先会触发一些先头报警,先头报警出现后可能会触发其他相关联报警,另一方面,这些相关联报警如果发生,报警的原因之一可能是冷却水缺水问题,二者存在相互关联的关系。
先头报警&可能触发的其他相关联报警
-冷却水流量低于设定值报警-冷却塔水盘液位低于设定值报警-冷机冷却水出水温度高报警-冷却水补水电磁阀故障报警-冷却水池低液位报警-补水泵故障报警 - …… | -冷机冷凝温度高于设定值报警-冷机冷凝压力高于设定值报警-冷机冷却水进水流量异常报警-冷机电流过大报警-冷机排气压力高于设定值报警-冷机停机报警-冷冻水供水温度高于设定值报警-冷冻水回水温度高于设定值报警-末端空调送风温度高于设定值报警-末端空调水阀开度高于设定值报警-机房冷通道温度高于设定值报警-机房热通道温度高于设定值报警-蓄冷罐水温高于设定值报警-…… |
---|
报警发生后,BA系统中会显示报警类型、编号、级别、处理建议等,工作人员根据告警策略中的处理建议立即采取措施,例如:
冷却塔水盘液位低于设定值报警 | 1.查看补水泵是否运行、故障或空转,补水泵现场或监控上是否打到手动位置。2.冬季确认冷却塔浮球是否结冰,导致浮球无法正常工作。3.确认浮球是否故障。 |
---|---|
冷却水池低液位报警 | 1.判断市政是否停水。2.判断补水池机械浮球或电控浮球是否可正常补水。3.判断自控系统是否正常供电(或补水电磁阀是否带电)。4.根据现场水池液位情况判断是否为真实报警。 |
补水泵故障报警 | 1.确认水泵上口是否带电。2.确认水泵配电柜内部原件是否有故障,如水泵交流接触器是否吸合,交流接触器是否有故障。3.确认水泵本体是否故障,例如轴承卡死、接线端子烧毁、电机线圈损坏等。4.确认现场故障无法恢复需立即切换系统。 |
冷却水回水流量低于设定值报警 | 1.确认冷却水泵运行频率是否正常。2.检查过滤器前后压差是否符合要求,判断是否堵塞需要清理。3.检查补水泵是否运行正常,可手动开启补水泵对系统强制补水。 |
冷却水补水电磁阀故障报警 | 1.监控系统确认阀门控制与反馈偏差值。2.现场关注执行器刻度位置是否与控制相符,如果执行器未到达控制位置,需要调整执行器。3.如果执行器到位。需要检测阀开度反馈电压,看是否有强电干扰。4.确认监控系统上阀门是否为手动开关。5.确认现场阀门旋钮是否打到手动位置。6.确认现场故障无法恢复需切换系统。 |
2. 日常维护
在日常的维护工作中,维护人员会根据实际情况定期对设备的易损相关部件进行维保,主要情况如下:
维保项 | 维保主要内容 | 维保频次 |
---|---|---|
冷却塔 | 1. 检查高、低液位补水浮球阀是否动作可靠,否则应修复。2. 检查布水器,是否有堵,并调整;内部杂质、尘土等清洗干净,无堵塞现象。3. 对积水盘进行清洗,换水;检查水盘是否有漏水,若有漏水,需更换压条或紧固螺栓。4. 对冷塔电动及手动阀门检查,对所有螺丝进行紧固,更换锈蚀部件。 | 季度或双月 |
补水泵 | 1. 检查泵壳密封圈是否可靠,机封处是否漏水2. 基座固定螺栓紧固。减震胶垫是否老化3. 检查电机运行的工况,包括电机风扇、绝缘电阻、灰尘。4. 电机前后轴承检查、泵侧轴承检查;加注润滑油5. 检查配电柜,清洁并紧固端子6. 检查变频器及阀门等设备。 | 季度或双月 |
冷却水池 | 1. 检查进出水阀2. 检查机械补水阀3. 检查电动阀4. 检查电控浮球 | 季度或双月 |
3. 日常巡检
日常巡检对于避免空调设备漏检、及时发现设备故障、及时发现现场风险、安全隐患等有重要的作用。腾讯某数据中心每天进行两次巡检,关于冷却水的巡检项目包括冷却塔、冷却水泵、补水泵、冷却水池、冷机等,巡检的要点如下:
巡检点 | 巡检要点 | 巡检频次 |
---|---|---|
冷却塔 | 配电柜、水盘水位、水质、浮球、风扇皮带、布水器、填料、运行声音、阀门等。 | 一天两次 |
冷却水泵 | 配电柜、运行声音、漏水情况、进出水压力等。 | 一天两次 |
冷却水池 | 检查液位、检查阀门等。 | 一天两次 |
冷机 | 运行声音、冷冻油油箱油位、漏油、阀门、漏水、面板参数、指示灯等。 | 一天两次 |
4. 应急预案
如果机房内发生了冷却水缺水的问题,根据问题的严重性选择解决方案,如果现场巡检人员能在5min内解决问题,使系统恢复正常状态运行则由现场巡检人员进行恢复;如果现场不能恢复,或恢复的时间超过5min,则立即切换另一套制冷系统,切换系统的流程按照制定的技术规程进行操作。在解决现场问题及切换设备的过程中,开启蓄冷罐保证冷量的需求。