用户名 密 码 验证码






协会 会刊 检测验收 新闻动态     人物 展会信息 数据中心     产品 技术前沿 专题 绿色节能 标准规范
论坛 专家 认证培训 业界资讯     企业 热点推荐 解决方案     厂商 项目信息 视频 优秀机房 图书推荐
    您的位置: 中国计算机用户协会机房设备应用分会 > 数据中心 > 机房在线改造工程的风险与控制
  产品中心 >>更多  
 
能源管理:远不止一
在设计精妙的数据中心基础设施中,智能PD
 
介绍一种数据机房即
某银行测试中心系统机房,为保障在线运行设
 
让IT系统自由呼吸
随着信息技术在企业中的普及、应用和深化
  技术前沿 >>更多  
· 阿尔法特何以在数据中心领域做到独领风
· 阿尔法特闪耀2016年中国
· 阿尔法特:整合产品优势,打造核心竞争
· 让IT系统自由呼吸
· 空调保护,UPS可有所作为
· 如何通过闪存存储提升数据库服务器性能
· “天河一号”超越“美洲豹” 成世界最
· 微软打造简单、机动、环保的未来数据中
· 无需制冷剂的数据中心降温系统诞生
· 艾默生推出新型数据中心能源节约方案
· 惠普新数据中心利用冷热空气混合保持恒
 
  机房在线改造工程的风险与控制  
机房在线改造工程的风险与控制
作者: 来源: 日期:2010-7-23 10:25:14

 

 

机房在线改造工程的风险与控制

中国人民银行清算总中心王红峰 王军

 

 

随着社会信息化建设步伐的不断加快,构建业务应用系统的IT设备日渐复杂,对场地条件的要求越来越高,很多机房面临在线改造。与新建机房不同,机房在线改造设计上受各种条件所限,施工要求在业务系统不间断运行下实施,因此存在很大技术和工程风险,改造效果有时也不甚理

想,被不少用户甚至施工单位视为畏途。本文分析了机房在线改造工程存在的技术和工程风险,从建设方角度探索控制风险的思路和策略,为相关工作提供了有价值的建议。

 

1 机房在线改造的主要特点

(1)什么是机房在线改造

机房在线改造,是指在业务系统设备正常运行条件下,对其运行支撑的机房场地环境进行改扩建的工程。改造目标常包括调整机房布局、扩大场地设施容量、提高场地安全防护能力。根据工程目标,工程内容常包括改造空调系统、UPS系统、供配电系统、消防系统、机房接地系统、网络布线系统、环境监控系统、照明系统,部分工程还涉及场地加固等工作。

(2)工程主要特点

机房在线改造工程的主要特点是:①不间断服务:改造期间,要求被改造机房维持局部区域温湿度、清洁度、供电、网络通信条件,提供IT设备工作环境,保持业务系统设备不间断运行。②实施复杂:待改造机房常处于办公大厦的中间位置,供电、UPS、空调、接地、消防、安全等系统是大厦在用系统的一部分,改造方案和施工条件多受大厦整体条件的限制,工程需要多家专业单位的协同工作,设计、实施、运作都比较复杂。

(3)工程技术风险突出

机房在线改造是工程技术问题多发领域,工程技术风险突出。机房建设工程涉及强电、弱电、暖通、消防、结构、装修等多个专业的设计和施工,设计和施工工作都要求具有不同专业资质的单位进行,专业间相互影响多,要求相互配合细节很多,涉及国家技术标准和规范多,涉及单位多,沟通协调难度大,易产生设计施工中的疏忽、遗漏和矛盾,工程技术风险较高。

(4)工程缺陷带来严重后果

与新建机房不同,如果设计或实施不当,不仅有可能造成被改造机房技术指标不正常或者损坏IT设备和场地设施,影响改造现场内业务系统的正常运行,甚至还有可能引起大厦或相邻其他机房的电力或空调系统故障,影响其他业务系统的运行,带来更大的损失,这令建设单位难以接受。另外,在线改造机房的工程技术问题造成的损失和后果在建成使用一定时间后才能发现,工程技术缺陷弥补困难。大量机房改造工程实践表明,机房在线改造属于事故多发工程,常常变成遗憾工程。

 

2 机房在线改造的工程技术风险

2.1 常见的技术风险

    机房在线改造的常见技术风险主要包括:

(1)场地设备配置不当,容量规划超标或不足,设备选型或技术指标设计失误,导致设备投资浪费,或投入使用后被迫追加设备。某金融运行中心机房改造后空调配备不足,机房局部过热,后被迫两次追加安装机房空调。某单位生产运行中心空调系统设计选型失误,空调系统无法开启,只得另行安装柜式空调弥补,无法达到精密的温度湿度场地条件。

(2)供配电系统、接地系统的设计和施工有缺陷,零地电压偏高、高频谐波分量偏高,电气可靠性差,机器缺乏正常运行环境。因某交易中心重要机房出现该问题,难以保证IT设备正常运行条件,IBM公司甚至拒绝

给设备上电。

(3)机房设计缺乏节能考虑,投入使用后运行维护费用居高不下,是很多机房建设的突出问题。某单位运营中心机房位于顶楼,两面为大面积玻璃窗和玻璃墙,天花板层薄且吊顶内未做节能处理,使用后电费消耗惊人,投资效益差。

(4)设计方案存在缺陷,开工后发现无法实施,被迫修改方案、追加投资、调整工期。某单位测试中心机

房施工中发现受现有环境的影响,必须调整设计方案,给备品备件室安装防静电地板,修改主电力电缆路由,增加了项目投资。

2.2 常见工程风险

与新建机房相同,在线改造工程在施工用电、施工用水、施工防火、成品保护等环节存在工程风险,工程界对此已有共识,有经验的施工方、建设方、物业管理部门对此都会有所考虑或制定相应工作制度。除此以外,在线改造工程因施工现场紧邻或就在设备工作区,受现场条件影响更多,尤其在现场清理与准备、在线施工保护、现场水电管路安装、系统迁移等环节施工风险很高。

(1)施工现场清理阶段的风险

①现场火灾风险。待改造机房一般已经使用多年,设备部件老化破旧,进入故障多发期,清理移动过程中可能发生设备故障甚至自爆自燃,有的机房堆积办公家具、安装材料等可燃物,火灾风险增加;

②电气系统故障。待改造机房常使用多年或经多次电气改造,电气线路安装资料缺失,难以对电气系统分阶段清理和保留整理提供帮助,需要施工人员逐条电缆查找分析。清理移动过程中,老化破损电缆很可能出现松动甚至短路等现象,造成电气系统意外故障。

③现场操作风险。现场设备与家具搬移、旧装修材料拆除等操作常有安全风险并出人意外。某单位机房施工清理现场中曾发生旧防静电活动地板坍塌事故,导致施工人员受伤,且险些酿成触电事故。

 

(2)在线施工的工程风险

水电管路安装风险。在线施工期间,因原有空调、UPS系统继续保持使用,而新安装的空调、UPS、临时供电供水等水电管路路由极易与已有管路矛盾,如强行安装则易造成管道泄漏,影响电力空调系统运行,导致业务系统不能正常运行甚至设备宕机或烧坏。某电信机房在线改造中电缆过水、电路短路、配电系统跳闸、设备宕机损坏、业务系统被迫停止运行。

在线保护风险。在线改造机房大部分情况下采取分阶段分区域施工,必须制作保护隔断,但施工中仍

发现不能保证设备工作的必要环境,不能阻挡施工粉尘和施工搬移物品的刮蹭,造成IT设备大量积尘、故障和物理损坏,影响业务系统稳定运行。

 

(3)系统迁移阶段的风险

机房在线改造不可避免涉及业务系统的运行设备迁移。IT设备下电后就有可能不能正常启动所有部件,更何况经历设备下电、拆除、物理搬运、重新就位、设备上电等一系列操作,系统迁移运作安排和操作稍有不慎,致使系统启动不成功的可能性很大。因此,也是影响业务系统稳定运行的重要因素,是工程风险之一。

 

3 机房在线改造的技术风险分析

工程实践中多次的经验教训表明,机房在线改造的技术风险产生于机房勘察、设计和施工的各个环节的工作中。

3.1 勘察工作重视不够,工作不足

由于在线改造是在已有机房基础上进行,工程规模可能不大,内容比较简单,设计方很容易忽视勘察工作,部分建设方经验不足,对勘察工作了解和要求不多。如果勘察工作缺失或不足,未发现某些限制条件或认识不够,很可能被迫修改设计方案或施工方案,导致施工内容的增减,给工程造价控制、运作管理带来麻烦。

3.2 设计工作出现失误

设计质量控制是技术风险控制的最重要内容。主要设计失误原因包括:

( 1 ) 未对场地需求进行细致分析,无法对容量进行准确规划,关键设备容量设计产生偏差;合理科学的设计以需求分析为基础。由于需求分析不够细致准确或设计人员经验能力的局限等原因,设计方案很可能存在技术疏漏或错误。

(2)对机房系统中影响IT系统可靠运行的关键性因素考虑不足,未进行相应设计,如对零地电压、谐波治理、防雷保护等涉及IT安全运行的问题考虑不够。

(3)部分专业工艺设计未按照国家有关技术规范和标准要求执行,或虽执行了国标要求,但并未进行详细的分析和计算。

(4)设计方案对运行成本考虑不够,节能设计考虑不够,对结构、装修材料、设备配置、电气空调系统节能问题未进行规划设计。值得注意的是,设计工作失误大部分是隐性的,可能到机房建成使用一定时间后才能发现且很难弥补。设计工作中的失误,少数可以在施工中通过有经验的设计单位审查发现进行弥补,但大部分失误无法弥补,只能在建设完成投入运行后才能发现。

3.3 施工方缺乏经验,组织管理不够严密

在线改造机房属于难度较大的项目,需要施工方有一定经验,了解和熟悉工程的风险点,高度配合各工作方,高度重视安全,严密组织管理,精心施工。如果既缺乏思想重视,又缺乏严谨的工作态度,组织管理不够有力,又没有一定的工作经验,那么出现施工意外事故也就不足为奇了。

 

4 机房在线改造工程技术风险的控制对策

机房在线改造的工程技术风险控制需要建设方、设计方、施工方、监理方高度重视,认识一致,密切配合工作。其中,建设方在控制工程技术风险方面可发挥重要作用。在充分认识工程技术风险的基础上,深入学习和掌握国家对工程质量的管理要求,建设方可以加强对工程技术风险控制的理解。在具体工作中,建议从以下具体环节中注意控制风险:

4.1 勘察风险防范

(1)明确勘察责任勘察责任应由勘察设计单位承担。在较小项目运作中,因无专门勘察单位,可将该部分工作合并给设计方。为充分保证建设方的权益,可将勘察工作要求、责任承担、勘察失误的罚责条款在委托勘察合同中明确表述。

(2)要求提供工作提纲和勘察报告为保证勘察工作质量,建设方宜要求勘察工作承担单位提供勘察工作提纲和场地勘察报告,作为勘察工作成果和勘察验收的依据,也可以做为后续设计、施工的重要依据文件。

(3)要求工作的过程质量对勘察工作提纲和勘察报告,建设方应保留审查权利。建设方应重点审查勘察单位的勘察提纲、勘察报告,检查内容安排是否符合国家规范要求。对工作过程的高度关注有助于提高工作质量。

4.2 设计风险的防范

(1)设计与施工采购分开虽然设计与施工分开使采购程序麻烦,但由有资质的设计单位专心于设计工作,可以使设计方案脱离施工单位的限制,更纯粹地考虑技术优化和技术安全,有利于控制整体工程技术风险。

(2)重视设计合同条款虽然设计方有专业的设计资质,但设计工作很有可能存在失误。建设方可在设计合同中明确要求设计责任、量化质量和失误条款、对失误的具体罚责条款以及验收指标条款等。设计合同的具体要求有利于设计方理解建设方对项目的要求,从而保证设计质量。

(3)重视设计方案审查建设方是设计质量的最终承担者,对设计方案的审查和具体要求将对设计质量产生重要影响。对设计文件资料的内容完整性和详细程度,建设方可依据建设部发布的《建筑工程设计文件编制深度规定》要求进行审查;对设计方案是否充分满足需求,是否方便可用,建设方可与最终用户一起审查确定。

(4)严格遵守国家技术标准和规范国家有关技术标准和规范凝聚了理论分析和科学计算的结果,经过实践检验,体现了工程界的智慧,很多具体要求甚至是在一个个事故中提炼出来的。这就要求设计方必须遵照执行,且对空调、电力等关键设计参数要求提供计算书。

(5)技术审查与专家评审设计方案专业性很强,建设方和用户审查很难发现设计方案在专业技术上的缺陷,因此,专业评审十分必要。建设方既可以通过政府专业质量监督部门的审查,也可以通过有关设计单位内部审查委员会,或者聘请中立第三方机构的领域专家和经验丰富的资深用户为设计方案进行技术把关。实践证明,对设计方案进行专业审查和专家评审,可以早期发现设计方案的的重大问题和漏洞,有效降低设计环节的技术风险。

(6)高度关注节能减排

能源费用是机房投入使用后的主要费用支出项目,有关权威机构的调查发现标准机房的电费在6千~15千元/m2,机房日常运行的能源消耗惊人。很多机房建成使用后发现耗能严重,但已经很难再做节能方面的调整。因此,将节能减排作为设计方案的主要目标,从设计方案开始考虑节能要求,并体现在各个专业的设计中,是建设方的现实选择。

4.3 施工风险的防范

为切实预防施工风险,建设方应做的具体工作是:

(1) 重视前期准备。取得机房前次装修的竣工资料以及电气系统、网络系统改造图等历史资料,尤其摸清进出机房的电气、弱电、接地、上下水、空调管路的安装路由,协助施工方一起确定涉电、涉水等施工危险区,了解风险点。

(2)谨慎清理现场。重视前期现场清理工作,合理安排清理工作计划和顺序,对现场设备、家具、物资的清理按照先外围再核心,先安全区再危险区的原则,将最有风险的工作放在最后集中办理,明确操作人员,确定操作步骤,尽可能停电操作,防范危险发生。

(3)重视在线保护。尽早明确分阶段施工的实施方案,在施工招标文件或合同中,按照保持运行设备工作环境的要求,明确提出在线保护隔断墙体的材质和封堵要求,以及可能的过渡运行所需要的临时供电、临时网络要求。考虑设备防尘和保温保湿要求,建议保护隔断墙体使用硬质板材和编织布等保护材料制作,注意吊顶和地板下空间的隔断和各种进出管线出入口的封堵。

(4)加强现场安全管理。建议要求施工方加强现场安全的组织和管理,落实防火、防电力系统故障的具体措施;对危险区域的相关工作和在线保护设施的安装施工,建议要求监理单位实施监督。

(5)认真规划系统迁移。提前规划好系统迁移的工作步骤,以及每台设备的机架摆放位置、供电插座、网络布线的线缆连接,注意负载均衡和可操作实施;提前检查通道、出入口、坡道的最大尺寸、角度、承重能力是否符合设备、机柜、家具的通过要求,并提前整改。

(6)落实系统迁移责任方。寻找专业IT系统维护服务公司参加系统迁移的规划、设计和实施,并承担系统搬迁工作责任,在出现设备故障时及时修复或更换备件。将系统迁移工作划分成细小的工作步骤并反复与有关各方讨论,组织由施工方、设备维护服务公司紧密配合,分别承担不同工作内容。

(7)制定应急预案。做好最坏的思想准备,设想可能发生的各种问题和故障,制订应急工作方案,并提前演练,确保在出现意外时,有关人员能及时了解现场情况并采取应对措施。


  友情链接  
    中华人民共和国工业和信息化部 中国计算机用户协会 机房360 比特网
中国计算机用户协会数据中心分会 版权所 © 2010
北京国信天元机房环境评测技术中心 Powered by SoarTec 京ICP备07502620号
您是第 位访客