用户名 密 码 验证码






协会 会刊 检测验收 新闻动态     人物 展会信息 数据中心     产品 技术前沿 专题 绿色节能 标准规范
论坛 专家 认证培训 业界资讯     企业 热点推荐 解决方案     厂商 项目信息 视频 优秀机房 图书推荐
    您的位置: 中国计算机用户协会机房设备应用分会 > 数据中心 > 网络机房在线搬迁全记录
  产品中心 >>更多  
 
能源管理:远不止一
在设计精妙的数据中心基础设施中,智能PD
 
介绍一种数据机房即
某银行测试中心系统机房,为保障在线运行设
 
让IT系统自由呼吸
随着信息技术在企业中的普及、应用和深化
  技术前沿 >>更多  
· 阿尔法特何以在数据中心领域做到独领风
· 阿尔法特闪耀2016年中国
· 阿尔法特:整合产品优势,打造核心竞争
· 让IT系统自由呼吸
· 空调保护,UPS可有所作为
· 如何通过闪存存储提升数据库服务器性能
· “天河一号”超越“美洲豹” 成世界最
· 微软打造简单、机动、环保的未来数据中
· 无需制冷剂的数据中心降温系统诞生
· 艾默生推出新型数据中心能源节约方案
· 惠普新数据中心利用冷热空气混合保持恒
 
  网络机房在线搬迁全记录  
网络机房在线搬迁全记录
作者: 来源: 日期:2010-7-22 13:08:52

 

网络机房在线搬迁全记录

农业部信息中心通讯与网络处 陶欣予 马婧

      随着网络规模的不断扩大,网络机房无论从面积、配套基础设施等各个方面都逐渐不能满足需求,针对这种情况许多单位选择重建机房。那么当新的机房建设完毕之后,如何将网络系统以及服务器、存储等设备迁移到新机房,则是一个较为棘手的问题。笔者所在的单位也刚刚进行了一次较大规模的机房搬迁工程。在此,将搬迁过程和经验简要记录下来,供各位同行参考,也欢迎大家批评指正。
      此次机房搬迁项目为全国首批十二金工程之一“金农工程”一期的一个子项目,主要任务为在国家农业数据中心机房建设完毕之后,将原网络机房所有服务器和存储设备、核心交换机、网络安全设备、负载均衡设备及出口路由器等200余台设备全部搬迁到新机房,楼层交换机上联链路也割接到新机房的核心交换机上,整个迁移过程要求过渡平滑,完成各系统的地点迁移并平稳、快速地恢复系统应用,实现对整个办公系统网络环境的升级与改造。国家农业数据中心新机房位于与原机房相距1 0 0米左右的新办公楼,总建筑面积约800平米,数据中心基础保障设施如UPS电源系统、空调制冷系统等完全重新建设。此外,随着应用系统的不断增加,整个网络系统规模也需要升级,因此新采购了互联网出口路由器、网络系统核心交换机、楼层接入交换机、服务器等设备,计划在机房搬迁之后一并进行集成部署。
      通过对机房搬迁任务的系统分析和研究,我们一致认为难点在于以下两个方面:
      首先,搬迁风险较大。由于设备数量较多,而且大多比较陈旧,大部分设备早已过保修期,此外业务系统众多,并且规模庞大。因此设备的搬迁安全性问题,包括设备安全性和数据安全性的保障显得尤为重要。其次,可能对用户造成较大影响。机房的迁移可能会导致整个单位的网络中断,尤其是对于一些特殊部门,网络中断对业务工作的正常开展影响较大,有可能导致严重后果。此外搬迁引起的业务中断,影响更为广泛,可能涉及全国各省相关部门的数据交流和信息发布。
      如何制定搬迁实施方案,才能将影响降至最小,并且一旦出现意外是否能够及时恢复或者解决,即建立有效可行的应急措施呢?这是需要我们解决的另外一个问题。农业部信息中心经过前期认真细致地调研,为了将机房搬迁对业务工作的影响降至最低,我们决定采用在线搬迁的方式,即建立平滑的网络过渡环境,以数据存储为核心,保障网络和应用系统运行的稳定性、连续性,最大程度缩短系统运行的中断时间。此外,建立完善的应急备份措施,出现问题易于诊断和解决,并将成本控制在可接受的范围。遵循这些原则,将整个搬迁划分为5个阶段来进行:
1、前期准备阶段
制定详细的搬迁方案,包括(1)设备搬迁方案,主要内容为搬迁设备统计、搬迁配套工具、搬迁日程和人员安排、搬迁后设备位置平面图;(2)网络割接方案,包括网络割接流程以及割接前后网络拓扑变化;(3)系统及数据备份方案,包括备份方式、人员以及时间;(4)应急方案,包括硬件故障、操作系统故障、数据库及应用系统故障、存储设备及数据故障应急方案。首先确定需搬迁设备清单,包括设备品牌、型号、IP地址、系统信
息、业务类型、归属部门等等,并进行分类。
      其次,将设备按照系统划分,安排合理的搬迁次序。机房设备的搬迁我们按照如下顺序:服务器、存储设备、网络设备、其他设备。其中服务器设备数量多达100多台,成为搬迁的重点。为了便于操作,我们对服务器也进行了详细的分类,包括办公网(私网)区域、互联网(公网)区域、托管区域,其中办公网区域和互联网区域服务器归属于我单位,而托管区域服务器则归属于系统内其他单位。
      然后,对所有设备及电缆进行标签、标记。按照设备位置及机柜立面图、设备位置对应表的方式一一对应设备连接关系。记录设备的连接情况,对连接网线,外设连接线做标识。其次对设备在新机房机柜中的部署位置进行规划,绘制出详细的部署平面图,
      此外,制定应急预案。由于设备在长时间开机后关机可能会有意外故障导致不能开机,或在搬运过程中可能导致硬件故障,所以备件准备是非常必要的。我们将新购设备为搬迁备件,尤其是服务器设备,在准备阶段可根据情况,安装操作系统以备出现意外时临时替用。
2、搬迁环境搭建
      由于我们原有部分设备使用时间较长,需要进行更换和升级,包括互联网出口路由器、核心交换机以及部分安全设备和服务器,因此在机房正式搬迁之前进行了采购,可以利用新购设备搭建搬迁过度网络环境。这样服务器搬迁后也不需要改变任何设置,从而确保系统的平滑过渡。过度网络环境示意图如下:


      在正式搬迁之前对新机房装修、机房综合布线、地面承重、搬运路线、机房辅助设施、监控室检查、机房温度与湿度、空调、电源电压、接地要求、UPS等等各个方面进行详细的检查和确认。此外,搬迁前对设备进行功能检查,确保系统及设备运行正常,并对数据进行备份。
      按照系统顺序及时间安排对设备进行拆卸运输,运输抵达新机房之后立刻进行安装、启动和状态检查,以及系统功能恢复与检测。在服务器运输过程中要求系统维护和使用人员全程陪同,并确认系统是否恢复正常;网络设备运输过程则请设备厂商工程师陪同协助。一旦出现异常则启动应急方案,争取最短时间内解决,同时在搬迁过程中做好详细的文挡记录工作。
      在设备搬运到新机房之后,如果出现硬件故障,硬件故障在备件准备范围内的立即更换,不在范围内的立即启用备用设备。由于配置或数据导致系统不能启动的使用系统光盘、备份数据等重新安装或恢复。
4、网络链路割接
      我们采用平滑割接的方式,首先将楼层交换机上联光纤链路逐步割接到新机房的新购核心交换机上,在服务器和存储设备搬迁完后,核心交换机在新机房,但网络出口还在旧机房。在新机房的出口结构搭建完毕并测试连通后,再把互联网出口从原机房切换到新机房,从而实现新整个网络系统的迁移。
5、系统测试及试运行
网络示意图
      机房技术与管理·28 ·2009年9月系统试运行阶段,时间为一个月。该阶段主要工作是观察记录整个系统的运行状况,维护系统的正常稳定运行。
      在经历两个多月的搬迁实施过程之后,我们在顺利完成在线搬迁任务的同时,也收获了一些宝贵的经验,在此与大家分享:


风险控制
      机房搬迁之所以会让人觉得棘手,其中最重要的一个原因就是其风险的不可预知和控制性,因此在搬迁前,必须进行充分的需求调研工作,准备好备机备件,制订详细的实施方案和应急方案,在设备搬迁前做好功能检测、系统健康检查以及详细标识工作,此外做好系统和数据备份工作也尤为重要。在正式迁移之前与用户沟通协调,由用户对搬迁时间和搬迁方式进行确认。对于非常重要的系统,为了降低搬迁风险,可以先进行系统迁移割接,再进行搬迁,一旦出现问题立刻恢复,这样可以最大程度控制风险。在新机房备用服务器上安装操作系统和应用软件,把系统数据迁移到新服务器上,把系统割接到新服务器上,系统运行稳定后,再对原有服务器进行迁移。
      为了降低搬迁所带来的风险,在搬迁前对搬迁设备按照业务系统进行分类,并按照系统的重要程度进行细化,确定安全等级,明确重点,划分权责。例如对于托管服务器,可在搬迁之前进行重新启动,如果机器能够正常启动,则进行正常搬迁;如果启动之后出现问题,与用户方及时沟通,解决问题,因为若设备使用时间过长,可能出现关机之后无法启动的情况,这样就避免了作为搬迁实施方的部分风险。

安全保障
      安全保障包括两个方面,设备的安全性和数据的安全性。由于我单位设备使用年限都比较长,设备较陈旧,搬迁实施过程中存在较大的安全风险。因此在设备搬运过程中,严格按照实施方案中的设备拆卸和运输原则进行。例如针对服务器硬盘,由于硬盘是服务器的数据仓库,因此硬盘的可靠性非常重要。在服务器的拆装过程中要特别注意服务器磁盘阵列内的硬盘顺序。如果磁盘阵列有顺序的要求,硬盘取出后一定要按照原来的摆放顺序插回磁盘阵列中,否则可能因无法识别而丢失数据。此外,由于本单位新旧机房之间距离比较短,运输过程中我们选择小推车作为运输工具,在车上和设备之间加垫缓冲物,以免在运输过程中震动过大,造成设备损坏。
      为保证数据的安全性,将所有数据进行备份。数据备份分为业务数据的备份、业务系统和业务系统平台备份、网络设备配置备份、设备连线和网络逻辑结构备份。在每批设备正式开始搬迁前一天进行数据备份,尽量保证备份数据完整性。并且数据备份利用多种途径由多方进行,例如服务器数据,在我们利用磁带库、磁盘阵列进行日常备份之外,再使用大容量移动硬盘进行备份。同时,提前与系统使用方进行沟通,由他们也自行进行备份。

时间安排
      此次搬迁任务时间紧、设备多、系统庞大,在考虑按时完成搬迁任务的同时,又要考虑对用户的影响,网络和应用系统只能在非上班时间中断,且业务中断时间不能超过30分钟,因此时间的安排也尤为关键。针对互联网区域和办公网区域,对于不影响日常办公的服务器,可以安排在上班时间进行搬迁;对于比较重要的应用系统服务器,搬迁风险非常小的,在下班后立刻执行搬迁,搬迁风险比较大的,则安排在周六、周日进行,若搬迁过程出现问题,可以有充分的时间来解决和恢复;其他设备比如网管室设备以及机柜等,统一安排在服务器搬迁完毕之后集中搬迁,并且为了不影响用户办公,选择在周末完成。


  友情链接  
    中华人民共和国工业和信息化部 中国计算机用户协会 机房360 比特网
中国计算机用户协会数据中心分会 版权所 © 2010
北京国信天元机房环境评测技术中心 Powered by SoarTec 京ICP备07502620号
您是第 位访客