您好,欢迎来到中国发电机网   请 登录免费注册
服务热线:
当前位置:首页 >> 资讯频道 >> > 行业新闻 >> 在线式数据中心供配电系统改造风险分析

在线式数据中心供配电系统改造风险分析

时间:2011-8-24 11:14:00   来源:中国绿色数据中心   添加人:admin

  引言

  随着国民经济的发展,信息化建设的步伐加快,原有数据中心提供的业务量已跟不上需求增长,供配电系统的可用性达不到现有标准,电气设备逐渐老化所带来的安全隐患突出,数据中心改造被提上议事日程。与新建机房不同,在线式数据中心改造受到各种条件的限制,工程须在保证机房重要负荷不停电的原则下进行,改造过程存在更大风险。

  本文将深入分析在线式数据中心供配电系统改造的风险,从设计、施工、调试、运行等角度提出风险控制的策略,并通过工程实践验证其对改造工程的指导作用。

  1、数据中心的可用性等级

  改造后的数据中心需要满足多方面的要求,即拥有更快的数据处理能力、更大的储存空间、更多的浏览量,当然也需消耗更多电力,占用更大空间,系统的复杂性将成倍增加。所有改工作的首要目的是确保新机房的可用性达到相应标准。按照TIA/EIA-942数据中心标准,据中的可用性分为四个等级,如表1所示。

  由表1可见,可用性等级越高,年允许故障时间越短。对于三级、四级负荷,一年中只要发生一次宕机事故,年内的可靠性就可能不达标,由断电导致的数据丢失、交易失败的损失将无法估算。

  2、供配电系统改造风险

  供配电系统作为数据中心的基础支撑平台,为机房负荷提供不问断电能,电能的品质直接影响数据中心负荷的运行安全。数据中心的供配电系统通常由市电装置、柴油发电机组、切换置、UPS装置及配出柜等组成。系统的架构如图1所示。

  供配电系统改造是根据现场情况,结合所要满足的指标,对供配电系统进行新增、扩容及调整。对于在线式数据中心,其内部重要负荷在改造过程中仍需保持带电运行,因此,改造工程面临更大的风险。

  图1数据中心供配电系统架构

  2.1设计风险及控制策略

  (1)勘察。设计工作在原有机房的基础上进行,旧机房使用多年或经过多次改造,原有电气资料早已缺失,并与现场情况不符。因此,必须做好现场勘查,掌握准确资料。如因勘察不足导致设计失误,在施工时发现将为时已晚,由此造成工程进度推迟甚至已采购材料报废,带来巨大损失。改造工程往往在原有大楼内进行,早期的机房大楼常设置在繁华商务区,可利用的空间较小。供配电设备体积庞大,设计布置必须充分利用空间,将原有系统与新增部分有机地整合,同时不影响在线机房设备的运行。

  (2)电能质量。机房负荷对于电能质量的要求很高,改造工程的设计需要严格控制电能质量,如零地电压、谐波治理、防雷保护等涉及IT安全运行的问题等。若这些问题处理不当,将严重干扰计算机负荷的运行。

  (3)设备复杂性。电力设备越来越复杂,设计师往往不能全面了解设备的情况。如UPS系统品牌型号多,导致了设计方案的多样性,设计师需要在众多的方案中选择,而每个方案都可能由性能和指标各异的元器件组成,选择过程往往存在巨大的风险。对于系统的多样性,应设计一个标准化的方案,根据指标规范,选择构造满足要求的系统。这样可以降低工作量,同时设计方案标准化、规范化也降低了组建的风险。

  (4)功率密度。随着科学技术的发展,用电设备的功率密度迅猛增加。如5年前l台典型的IT机柜内可以放5~8台服务器,功率密度大约为每个机柜1.0~1.5kW;而如今刀片式服务器广泛运用,极端情况下每个机柜内负载量甚至能够达到10~15kW,且数值还在增长。虽然客户对于未来功率的急剧增加都持肯定态度,但究竟增加多少无法估计。新增容量不足将导致数据中心下一次改造的提前,而新增容量太大会增加投资且受场地限制。新增容量的确定应在各个因素间寻求平衡。

  (5)断路器设置。大型数据中心设计中常采用集中式UPS系统,设计师在供配电系统和关键负载问设置了许多断路器。实际上每个断路器都是一个潜在的故障点,都可能影响数据中心的安全。断路器设置数量越多,关键负荷越不可靠。参数相同的断路器,其实际的动作电流值可能相差悬殊,不同厂家的产品之间配合的风险尤其突出,在极端情况下来自不同厂家的产品安装在同一条的供电路径作保护配合,下游的故障没有使近一级的断路器保护动作却启动了上一级的断路器跳闸,从而导致停电范围扩大。因此,设计师应尽可能减少UPS与负载之间的断路器数目,并采用更加标准化的产品。

  2.2施工风险及控制策略

  在线数据中心的改造要求边施工边运行,即在工程施工中保持被改造机房的局部区域温湿度、清洁度、供电、网络通信条件,提供IT设备工作环境,保持业务系统设备不间断运行。

  (1)协作配合。需改造的供配电设备往往位于大楼的底部楼层,施工条件受大楼整体条件的限制,工程需要多家单位协同工作,同时供配万方数据电系统的改造也涉及到许多专业,需要建筑、结构、暖通、给排水等专业配合。各单位、各专业之间,设计师与施工人员、监理、顾问之间互相影响,跨专业、跨领域的问题多,涉及的技术规范和标准多,需要处理的细节多,沟通协调难度大,极易出现遗漏或配合不当而导致风险。因此,需要参与工程的各方高度莺视、密切配合,现场严格组织管理,施工精益求精。

  (2)在线保护。改造工程往往与现有机房位于同一幢楼内,工程施工不当将会对原有系统构成隐患。如电源侧设备的改造处理不当会影响现有的运行设备,甚至引起本楼机房或相邻其他机房的断电。在线施工期间,原有供电装置、UPS继续保持使用,而新安装的供电装置、UPS及供施工的临时供电、供水等水电管路极易与已有管路矛盾,如强行盲目施工极易破坏原有的管路,导致原有系统不能正常运行,甚至设备宕机。

  因此,改造工程应先掌握现场情况,包括原有涉水、涉电区域及路径走向,在现场设置相应的保护区,严格区分现有管路和改造管路,对于为关键负荷供电的设备区域应设为禁区加强保护。

  (3)施工质量。机房负荷对电能质量非常敏感,施工质量关系到今后设备能否正常运行。如接地系统的施工缺陷将带来零地电压偏高、高频谐波分量偏高、电气可靠性差的风险。因此,控制施工质量、加强管理和监督是必不可少的措施。

  (4)时间控制。数据中心内的大型供配电设备部件均有较长的交货周期,客户需要提前采购这些设备,如果中间环节稍有耽搁,将会影响整个工程进度。同时,市场瞬息万变,如果施工时间太长,当新设备全部投入使用时设计方案可能已经过时。

  2.3调试风险及控制策略

  调试过程是将在线式数据中心负荷从旧电源系统转换到新电源系统运行的过程,状态转换后所有新接人的供配电系统装置将带电运行经受考验,因此调试阶段风险较大。新供配电系统应经过一个充分的试运行阶段,以检验新系统的可靠性,尽可能排查各种可能的故障风险。同时,调试方案必须完善周密,将所有设备同时切换至新系统运行的方案存在巨大风险,而将切换过程分割为许多风险可控的部分,按照施工一部分、通电调试一部分的原则循环操作是比较合理的。在调试过程中应满足新装置回路一旦发生故障被迫断电时,关键设备的用电也能由其他电源系统保证,即保证在线式机房永远在线。

  2.4运行风险与控制策略

  改造后的数据中心供配电系统的拓扑结构发生了变化,新的设备替代或者作为旧设备的备用,系统的冗余度更高,容错能力更强,所能提供的容量增大,这些都提高了数据中心负荷的可用度。但运行过程中的风险仍然不可忽视,任何的疏忽都可能造成重大损失。

  (1)人为失误。国外权威的调查机构UP TimeInstitute提供的信息表明,54%的宕机故障都是人为因素造成的。人为失误的首要原因是机房供配电系统复杂性高,又缺乏处理这类复杂系统的专业技术人员。因此,需加强专业技术人员的培训与管理,规范操作流程,降低人为风险。

  (2)故障排除。数据中心电力基础设备非常复杂,由许多大型装置及子系统组成。一旦发生故障,维修人员在并机系统、UPS、配电装置、大型静态开关等之间迅速作出正确判断相当困难。供配电系统的复杂程度的增加使操作失误的可能性增大,同时也使确定及排除故障点的时间加长。电力系统的复杂性对操作人员提出了更高的要求,同时产品提供商需能提供及时排除故障的服务。

  (3)电缆管理。数据中心内大量的电缆由配电柜接至机房负荷,负荷量增加需要配电柜不断引出新电缆,机房夹层内的电缆往往纵横交错,一旦发生故障,需要排查某个回路时将耗费大量的时间。因此,电缆的日常管理相当重要。同时,对于负荷的重要性应加以区分,重要负荷与普通负荷不应由同一个配电柜供电,以免非重要负荷故障导致区域性跳闸停电而影响重要负荷。

  3、工程实例

  某运营多年的数据中心,改造前采用2路10kV市电供电,2路常用,同时配置柴油发电机作为后备电源,为机房负荷供电。机房负荷的供电连续性由一套集中式UPS装置保证。其供配电系统主接线如图2所示。

  图2某数据中心原供配电系统示意图

  原供配电系统存在的风险主要有:

  (1)末端的机房负荷采用双电源、单回路的供电方式,可靠性不高。

  (2)机房负荷与非机房负荷共用变压器,互相干扰,影响机房供电安全。

  (3)机房负荷容量陡增,原有变压器、柴油发电机、UPS装置无法满足扩容要求。

  (4)柴油发电机不能为服务机房的动力负荷(如机房空调等)供电。一旦两路市电故障,影响机房设备正常运营。

  新系统必须在满足机房负荷高可靠性供电要求、增加容量的同时,使改造工程不影响现有机房运营。因原系统已无增容可能,对于机房负荷新增2路独立10kV进线电源(3#、4#.电源)、新增变压器(T3、T4)、集中式UPS装置(含冗余模块)及柴油发电机(2#发电机)。其余非机房负荷仍由原有变压器(T1、T2)供电。改造后的供配电系统主接线如图3所示。

  图3

  新系统中对于机房负荷采用双电源、双回路的供电方式,两路电源互为全备用。市电与柴油发电机切换后经集中式UPS装置处理,提高了供电的可靠性。机房的空调电源及其他重要负荷接人柴油发电机馈电柜,提高了机房的可用性。改造工程从设计、施工、调试到试运行历时一年半,按照风险控制的策略控制每个环节。机房负荷供电由全套的新配电系统代替原有系统降低了改造工程的风险;切换过程分步骤、分时段实施,切换前将业务进行转移,主要切换过程安排在大型节假日(如春节等时段)进行。经实践证明,工程改造取得了预期的效果。

  4、结语

  对于逐渐老化的数据中心,不是每个企业都具备重新创建新数据中心的条件。在这种情况下,通过在线式改造提高供配电系统可靠性、增加冗余度、增强容错能力、推动业务增长并提高机房负荷可用性,是一个现实的选择。在线式数据中心的供配电系统改造面临各种风险,本文分别从设计、施工、调试、运行4个方面分析了工程中可能发生的典型风险,提出了风险控制的策略,并通过工程实践验证了其对改造工程的指导作用。

  「l」朱伟雄,王德安,蔡建华。新一代数据中心建设理论与实践[M].北京:人民邮电出版社2009.「2」张广明,韩林。数据中心UPS供电系统的设计与应用[M」。北京:人民邮电出版社2008.「3」国家电网公司。供电可靠性管理实用技术[M].北京:中国电力出版社2008.