容灾概述
容灾的定义容灾是一个范畴比较广泛的概念。从广义上说,可以把与业务连续性相关的内容都纳入容灾。因此,容灾是一个系统工程,包括支持用户业务的方方面面。容灾对于IT而言,就是提供一个能防止业务系统遭受各种灾难而破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是灾难发生后的亡羊补牢。 从狭义上说,我们平常讨论的容灾是指,除了生产站点以外,另外建立容灾站点,当灾难发生、生产站点被破坏时,冗余站点可以接管业务,达到业务不间断的目的。 容灾的技术指标衡量容灾系统有以下几个主要指标。 以恢复点为目标(RPO:Recovery Point Object) RPO代表当灾难发生时,允许丢失的数据量。在同步数据复制方式下,RPO等于传输延迟时间内的数据丢失。在异步数据复制方式下,RPO为异步传输数据排队时间内的数据丢失。 以恢复时间为目标(RTO:Recovery Time Object) RTO代表当灾难发生时,系统恢复运行的时间。 以网络恢复为目标(NRO:Network Recovery Object) RPO与RTO越小,系统的可用性就越高,当然需要的投资也越大。
容灾技术方案的七个级别容灾技术方案的七个级别:7 Tiers for Disaster Recovery Solution,是指根据国际标准SHARE 78的定义,容灾技术方案可以根据以下主要方面所达到的程度而分为七个级别。
1、备份/恢复的范围; 2、灾难恢复计划的状态; 3、生产站点与容灾站点之间的距离; 4、生产站点与容灾站点之间是如何相互连接的; 5、数据是怎样在两个站点之间传送的; 6、允许有多少数据被丢失; 7、怎样保证更新的数据在容灾站点被更新; 8、容灾站点可以开始工作的能力。 即从低到高有七种不同层次的灾难恢复解决方案。如下图所示,七个级别的灾难恢复的技术方案分别是: 0层:没有异地数据(No off-site Data)
即没有任何异地备份和应急计划。数据仅在本地进行备份恢复,没有数据送往异地。事实上这一层不具备任何灾难恢复能力。 1层:PTAM卡车运送访问方式(Pickup Truck Access Method)
这一层的容灾方案必须设计这样一个应急方案,就是能够备份所需要的数据,并将其存储在异地。PTAM指将本地备份的数据用交通工具送到远方。当生产中心发生灾难性事件时,需要采购一套新的硬件设备,重新搭建系统,并通过保存在异地的磁带恢复生产数据。这种方式的成本比较低,可以在一定程度上实现数据备份,但是恢复生产的时间过长。 2层:PTAM卡车运送访问方式+热备份中心 (PTAM + Hot Center)
相当于在第1层基础上,加上热备份中心能力的进一步的灾难恢复。热备份中心应该拥有足够的硬件和网络设备去支持关键应用。相比于第1层,当遭遇灾难时,减少了硬件采购和实施的环节,可以直接在已有的硬件平台基础上,用异地存储的数据磁带进行恢复。与第一级相比,虽然增加了硬件成本,但是明显降低了灾难恢复时间。
3层:电子链接 (Electronic Vaulting)
第3层是在第2层的基础上,用电子链路取代卡车进行数据传送的进一步的灾难恢复。生产中心的数据通过远程数据复制,在容灾中心实现数据的备份。灾难发生时,容灾中心的数据很容易的在备份的硬件系统上运行起来,再次提高了灾难恢复速度。
4层:活动状态的容灾中心 (Active Secondary Center)
第3层的基础上,处在异地的备份站点保持运转,对关键数据进行实时复制。
5层:两个活动的数据中心,确保数据一致性的两阶段传输承诺(Two-Site Two-Phase Commit)
第五层提供了更好的数据完整性和一致性。也就是说,第五层需要生产中心与容灾中心的数据被同时更新,从供能和实现任务的角度上,两个中心几乎没有区别。此外,工作负载可以同时有两个中心分担执行。由于两个中心的数据实时复制,所以在灾难发生时,只存在网络切换的时间,几乎不存在其他数据恢复的延迟,恢复时间被降低到分钟级。数据也仅是传送中的那部分数据丢失。
6层:0数据丢失 (Zero Data Loss),自动系统故障切换
第6层可以实现0数据丢失率,被认为是灾难恢复的最高级别,在本地和远程的所有数据被更新的同时,利用了双重在线存储和完全的网络切换能力,当发生灾难时,能够提供跨站点动态负载平衡和自动系统故障切换功能。
本文出自 51CTO.COM技术博客 |


gulibin
博客统计信息
热门文章
最新评论
友情链接