两地三中心容灾备份系统建设及成效论文
2020-09-26 23:19:45 210
随着中国人民银行省级数据中心建设的不断深入和信息系统集成趋势的不断发展,中国人民银行省级数据中心承担的任务中国变得越来越重。目前,中国人民银行南京分行(以下简称“个人银行南京分行”)共维护了136个应用系统,其中近80个系统部署在省级支行数据中心,其中18个总行信息系统,以及超过60个分支机构的自建系统。系统用户覆盖江苏,安徽两省人民银行及各金融机构;该业务涉及多个部门,例如货币信贷,国库会计,人员,官方文件和统计调查。如何保护这些信息系统的安全,特别是重要信息系统的数据的安全性,已经成为该分支机构科学技术安全工作的重要组成部分。
1.信息系统中的数据安全性问题
(1)数据中心存储设备中的单点故障风险
近年来,中国人民银行南京分行的数据中心系统服务器和光纤交换机已经实现了双机冗余保护,但是存储设备仍然使用总行在2010年发布的HDSAMS2500。该模型存在以下问题:首先,它只有一个功能,不能实现诸如跨阵列快照之类的功能。如果在启动备份操作之前数据丢失,则无法恢复;其次,只有一个存储设备,一旦出现故障,本地和远程都将没有高可用性数据保护,并且部署在省级数据中心的所有总部业务系统都会受到严重影响。
(II)分行自建信息系统缺乏数据保护
目前,中国人民银行南京分行使用VMwarevSphere5.0构建虚拟化应用程序平台,并使用该平台部署分支机构自建系统的60多个应用程序。这些系统通过VMware HA提供统一且经济高效的硬件和系统故障转移保护。但是,除了某些通过CDP,Symantec NBU,EMC Avamar等备份的系统之外,没有其他对系统数据的备份保证。
(3)系统灾难恢复水平低
在省级数据中心备份的系统中,只有PBC帐户管理系统每10分钟通过远程备份到总部北京总部CDP系统灾难恢复中心。其他系统使用磁带,EMC Avamar和其他软件和硬件产品来执行日常数据备份。此方法仅实现数据备份和灾难恢复时间(RTO)和恢复目标点(RPO)相对较长,不能保证重要应用系统的连续运行。
在两个,三个和三个中心中构建灾难恢复备份系统
为了解决上述问题,中国人民银行南京分行打算采用“两地三中心:同城异地灾难恢复”模式:在南京建设同城数据灾难恢复中心,实现生产中心重要应用系统数据和数据的实时同步复制访问;在管辖范围内构建异地数据备份中心将生产中心的重要业务数据连续备份到远程灾难恢复中心,以减少发生灾难时的数据丢失,从而为分支机构的省级数据中心提供有效的数据保护。
(1)同一城市中的灾难恢复/异地备份中心的位置
人民银行南京分行在南京市区有两个计算机房,其中一个位于分支机构,另一个位于分支机构业务管理部门。机房相距2公里,并配备了千兆位光纤通信线。分支机房用作生产机房。总部发行的HDSAMS2500构建SAN存储网络并部署大多数数据中心系统。管理部门的机房配备有EMCVNX5150和相应的SAN存储网络,用于其内部虚拟化结构。因此,选择管理部门的机房作为同一城市的数据灾难恢复中心。
除管理部门外,该分支机构管辖范围内共有12个地级市和城市分支机构,每个分支机构都通过IP链路与分支机构进行通信,带宽为8Mmt / s。有6个中间分支机构,距离该分支机构200多公里,其中,中国人民银行中央苏州分行(以下简称“个人银行苏州中央分行”)已经具有EMCVNX5150和SAN存储网络。它具有全面的地理位置,机房条件和硬件设备。由于各种因素,决定选择中国人民银行中央支行机房作为异地数据备份中心。
二(II)方案选择
人民银行南京分行主要研究和比较了三个更成熟的灾难恢复计划:IBMSVC异构存储灾难恢复解决方案,HDSGAD解决方案和EMC Vplex Metro&RecoverPoint Crr解决方案。
1.IBM SVC异构存储灾难恢复解决方案
IBM SVC是一种存储虚拟解决方案。它可以将不同的存储设备映射到SVC的内部存储单元MDISK(受管磁盘)。一个或多个Mdisk被虚拟化到一个存储池中以提供存储服务。
SVC异构存储灾难恢复解决方案是通过SVC实现异构存储的集成,然后使用“ Vdisk Mirror + Metro Mirror”功能执行本地存储高可用性和数据灾难恢复同步复制。其中,Metro Mi rror可以支持300公里以内的两个计算机房之间的数据同步复制,因此可以满足同一城市灾难恢复中心和远程备份中心的距离和数据容灾要求。但是,此解决方案需要灾难恢复/备份中心和生产中心。它们都需要直接通过光纤网络传输数据,而现有的网络条件无法满足;生产中心需要配置本地存储,总投资较大。
2.HDSGAD解决方案
HDSGAD(全局活动设备)解决方案是基于存储的高可用性解决方案。 GAD由两个高端存储G1000组组成结果,当两个存储之间的距离在100公里之内时,用户数据可以在两个存储中实时复制并提供外部数据访问服务。用户主机可以访问任何存储数据。如果一个存储设备发生故障,则可以在不中断另一存储设备的情况下访问服务(如图1所示)。该解决方案可以实现“主动-主动”数据访问,但是不能满足远程备份中心的要求,并且需要购买投资巨大的G1000存储设备。
3.EMC Vplex Metro和恢复点Crr解决方案
EMC Vplex Metro是一种存储虚拟化解决方案,它使用光纤通道连接不同品牌的不同数据中心(距离小于10)一千个M)将存储设备虚拟化为一个统一的存储资源池。通过同步(时间延迟小于5毫秒)镜像复制功能,两个数据中心中存储的数据的高可用性得以维持(如图2所示)。同时,通过“主动-主动”技术,可以实现类似于HDSGAD解决方案的主动-主动数据访问。因此,EMC Vplex Metro可以满足分支机构业务管理部门的同城数据灾难恢复要求,而无需添加其他设备。
EMC RecoverPoint Crr(连续远程复制)是连续的远程数据复制。它可以通过光纤通道或WAN为距离大于100公里的数据中心提供双向数据块复制(如图3所示)。因此,满足了中国人民银行南京分行-中国人民银行苏州中智的异地数据备份要求。
与三种解决方案相比,只有EMC Vplex Metro&RecoverPoint Cn解决方案才能充分利用分支机构的现有存储和网络资源,以较少的资金投入实现两个中心的灾难恢复系统的建设目标。中国人民银行南京分行最终决定采用该方案。
(3)在同一城市建立数据灾难恢复中心
通过EMC Vplex Metro虚拟存储技术,中国人民银行南京分行将生产中心的HDSAMS2500和灾难恢复中心的EMCVNX5150分为两个异构存储计划2T空间映射到单个2T容量存储池(存储池),并且虚拟存储的分布式镜像功能用于执行数据的远程同步复制。即,将生产中心的应用程序系统数据通过Vplex分割后,将同时写入到本地和同一城市灾难恢复中心的存储设备中。然后,通过VMware的在线迁移(VMotion)培训,可以将分支虚拟化平台上的重要系统迁移到存储池而无需停止。这样,一旦生产中心中的存储发生故障,存储池中的系统就可以立即访问同一城市的灾难恢复中心中相应存储设备上的数据。确保连续访问数据。图4显示了同一城市的数据灾难恢复体系结构。
(IV)异地数据备份中心的建设
中国人民银行南京分行预留了10T空间在生产中心的HDSAMS2500和苏州中央分公司的异地数据备份中心的EMCVNX5150上进行远程数据备份一致性组使用EMC RecoverPoint Crr通过IP链路复制数据,以实现连续的远程异地备份。也就是说,当生产中心执行写操作时,应用系统数据将通过Vplex引擎分为两个相同的副本,一个被写入本地存储,另一个被传输到本地RPA。压缩后,按照预定的复制策略进行压缩,每隔几分钟,通过IP链接将其传输到苏州异地备份中心的RPA中,然后将其写入异地备份中心的存储中。形成日志以保持与生产中心的数据一致性(如图7所示)。同样,仍通过VMware VMotion功能将分支虚拟化平台上具有重要数据重要性的某些系统迁移到此一致性组。
经过多次测试,在现有网络带宽条件下(最大带宽为8Mbit / s),第一次数据复制的时间较长,但是第一次复制完成后,可以按照每15分钟生成一次。既定的策略。数据快照(如图8和9所示)。当生产中心数据损坏时,备份中心可以在任何快照时间点提供数据备份,以恢复数据。
III。取得的成果
(―)提高了重要的自建系统的可用性并获得了系统的活动数据
同城数据灾难备用中心建成后,数据就可以了。跨站点共享并且无中断迁移。测试表明,一旦生产中心中唯一的HDSAMS2500发生故障,部署在生产中心虚拟化平台上的存储资源池中的应用程序系统就可以通过Vplex的Active-Active技术快速自动地切换到同一城市灾难恢复中心中的存储。该系统实现了无中断的数据访问,消除了故障处理所需的先前存储操作,并解决了存储单点故障的风险,从而确保重要的自建业务系统的连续运行,提高了系统可用性,并实现了数据-活动应用程序。 。同时,两个中心之间的数据复制可以根据应用系统的重要性级别选择同步/异步方法,以最有效地利用网络带宽资源。
(2)优化现有系统灾难恢复结构并提供分层灾难恢复服务
在同一城市数据灾难恢复中心和远程数据备份中心建成后,省级中国人民银行南京分行数据中心现有系统灾难恢复结构已经优化。根据应用系统的重要性,数据中心可以提供不同级别的灾难恢复服务。
在第一种情况下,可以通过EMC Vplex实时将对数据安全性和业务连续性有很高要求的系统以及会造成重大损失的业务中断实时备份到同一站点城市灾难准备中心。当生产中心发生存储故障时,可以实现快速切换以获得RPO? 0和RTO? 0.
在第二种情况下,对业务连续性要求不高,但数据丢失会造成重大损失的系统可以通过恢复点连续备份到苏州异地备份中心。当生产中心发生灾难时,可以提供RTO <15分钟的次优备份服务,从而大大减少了重要数据的丢失。
在第三种情况下,对于常规业务系统,可以通过EMC Avamar系统,磁带设备等提供RTO = 24小时常规备份服务。
(3)充分利用现有资源,提高省级数据中心对各种灾害事件的应急响应能力
灾难恢复备份系统的构建使用虚拟存储技术来生产中心和灾难恢复中心的存储阵列可以支持异构不同品牌和型号的产品。因此,生产中心仍然使用原始的HDSAMS2500存储设备,这不仅节省了灾难恢复成本,而且使项目的实施过程更加简单。对系统操作有影响。
同时,同一城市数据灾难恢复中心和异地数据备份中心建成后,容灾距离得以延长,重要数据和应用程序的保护水平得到提高。中国人民银行南京分行省级数据中心不仅可以应对本地存储设备的故障,而且在面对洪灾,火灾,地震等重大区域性灾难时具有可靠的数据保护,并提高了应急响应能力。
第四步,下一步
项目完成后,中国人民银行南京分行计划开展灾难恢复模拟测试演练和数据中心的恢复。首先是在同一个城市灾难恢复中心中构建虚拟化应用程序平台,部署生产中心的重要业务系统,并在“生产中心发生重大灾难时模拟与城市的快速系统同步,以及服务器和存储硬件设备已损坏。”灾难备份开关。
22是在“同一城市的生产中心和灾难恢复中心发生事故且无法正常运行”的条件下模拟紧急演习。通过这些试验和演练,进一步提高了中国人民银行南京分行省级数据中心的灾难恢复水平,为省级数据中心系统提供了更加全面,可靠的保护。