数据备份与数据容灾全解析
数据备份与数据容灾全解析 一、数据容灾与数据备份的联系
企业关键数据丢失会中断企业正常商务运行,造成巨大经济损失。要保护数据,企业需要备份容灾系统。但是很多企业在搭建了备份系统之后就认为高枕无忧了,其实还需要搭建容灾系统。数据容灾与数据备份的联系主要体现在以下几个方面:
1. 数据备份是数据容灾的基础
数据备份是数据高可用的最后一道防线,其目的是为了系统数据崩溃时能够快速的恢复数据。虽然它也算一种容灾方案,但这种容灾能力非常有限,因为传统的备份主要是采用数据内置或外置的磁带机进行冷备份,备份磁带同时也在机房中统一管理,一旦整个机房出现了灾难,如火灾、盗窃和地震等灾难时,这些备份磁带也随之销毁,所存储的磁带备份也起不到任何容灾功能。
2.容灾不是简单备份
真正的数据容灾就是要避免传统冷备份所具有先天不足,它能在灾难发生时,全面、及时地恢复整个系统。容灾按其容灾能力的高低可分为多个层次,例如国际标准SHARE 78 定义的容灾系统有七个层次:从最简单的仅在本地进行磁带备份,到将备份的磁带存储在异地,再到建立应用系统实时切换的异地备份系统,恢复时间也可以从几天到小时级到分钟级、秒级或0数据丢失等。
无论是采用哪种容灾方案,数据备份还是最基础的,没有备份的数据,任何容灾方案都没有现实意义。但光有备份是不够的,容灾也必不可少。容灾对于IT而言,就是提供一个能防止各种灾难的计算机信息系统。从技术上看,衡量容灾系统有两个主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了当灾难发生时允许丢失的数据量;而RTO则代表了系统恢复的时间。 3. 容灾不仅是技术
容灾是一个工程,而不仅仅是技术。目前很多客户还停留在对容灾技术的关注上,而对容灾的流程、规范及其具体措施还不太清楚。也从不对容灾方案的可行性进行评估,认为只要建立了容灾方案即可高枕无忧,其实这具有很大风险的。特别是在一些中小企业中,认为自己的企业为了数据备份和容灾,整年花费了大量的人力和财力,而结果几年下来根本就没有发生任何大的灾难,于是放松了警惕。可一旦发生了灾难时,后悔晚矣!这一点国外的跨国公司就做得非常好,尽管几年下来的确未出现大的灾难,备份了那么磁带,几乎没有派上任何用场,但仍一如既往、非常认真地做好每一步,并且基本上每月都有对现行容灾方案的可行性进行评估,进行实地演练。
二、数据容灾等级
设计一个容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等。根据这些因素和不同的应用场合,常见的容灾备份等级有以下四个:
第0级:本地备份、本地保存的冷备份
这一级容灾备份,实际上就是上面所指的数据备份。它的容灾恢复能力最弱,它只在本地进行数据备份,并且被备份的数据磁带只在本地保存,没有送往异地。
在这种容灾方案中,最常用的设备就是磁带机,当然根据实际需要可以是手工加载磁带机,也可以是自动加载磁带机。前者主要适用于存储数据容量较小的中小型企业,主要产品有IBM的TotalStorage Ultrium 外置式磁带机 3580,单盒磁盘窝囊可达200GB,压缩后可存储400GB数据,可满足绝大多数中小企业,乃至大型企业数据备份需求。HP的磁带机产品线更是非常全面,手工加载的磁带机目前主要有HP Surestore DAT 24、HP Surestore DAT 40、HP StorageWorks DAT 72,它们单盘磁带所能存储的容量分别是24GB、40GB和72GB,不同用户可灵活选择,另外HP还有一个LTO-Ultrium磁带机系列磁带机和DLT/SDLT系列磁带机。
自动加载磁带机中IBM主要有 TotalStorage企业磁带机 3592,HP有StorageWorks DAT 40x6T等。
注:以上只是拿IBM和HP这两个著名品牌的产品作代表进行说明,其实还有许多其它品牌的磁带机产品可选择,如日立、索尼、富士通等。除了选择磁带机外,还可选择磁带库、光盘塔、光盘库等存储设备进行本地备份存储。
第1级:本地备份、异地保存的冷备份
在本地将关键数据备份,然后送到异地保存,如交由银行保管。灾难发生后,按预定数据恢复程序恢复系统和数据。这种容灾方案也是采用磁带机等存储设备进行本地备份,这些磁带设备的选择可参见前面介绍。同样还可以选择磁带库、光盘库等存储设备。
我们常常见到一些公司为了避免备份磁带因机房安全问题而出现磁带被除数盗、被毁,通常是把备份磁带,特别是月以上的备份磁带放入专门的保险柜,甚至租用银行的专门保险箱来存放这些备份磁带。但这还不能说是万元一失,原因就是,一般来说这些保管磁带的地点与所在公司在同一城市中,万一出现了地震、战争之类的自然灾难,这些备份磁盘还是难逃厄运。
第2级:热备份站点备份
在异地建立一个热备份点,通过网络进行数据备份。也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点。备份站点一般只备份数据,不承担业务,拓扑结构。当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。
这种异地远程数据容灾方案的容灾地点通常要选择在距离本地不小于20公里的范围,采用与本地磁盘阵列相同的配置,通过光纤以双冗余方式接入到SAN网络中,实现本地关键应用数据的实时同步复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业务的镜像数据。该数据是本地生产数据的完全实时拷贝。对于企业网来说,建立的数据容灾系统由主数据中心和备份数据中心组成。
其中,主数据中心采用高可靠性集群解决方案设计,备份数据中心与主数据中心通过光纤相连接。主数据中心系统配置主机包括两台或多台服务器以及其他相关服务器,通过安装HA软件组成多机高可靠性环境。数据存储在主数据中心存储磁盘阵列中。同时,在异地备份数据中心配置相同结构的存储磁盘阵列和一台或多台备份服务器。通过专用的灾难恢复软件可以自动实现主数据中心存储数据与备份数据中心数据的实时完全备份。在主数据中心,按照用户要求,还可以配置磁带备份服务器,用来安装备份软件和磁带库。备份服务器直接连接到存储阵列和磁带库,控制系统的日常数据的磁带备份。其中,光传输设备作为两个数据中心之间的传输设备,两个数据中心利用光传输设备通过光纤组成光自愈环,可提供总共高达80G(保护)和160G(非保护)的通信带宽。
第3级:活动互援备份
这种异地容灾方案与前面介绍的热备份站点备份方案差不多,不同的只是的主、从系统不再是固定的,而是互为对方的备份系统。这两个数据中心系统分别在相隔较远的地方建立,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。通常在这两个系统中的光纤设备连接中还提供冗余通道,以备工作通道出现故障时及时接替工作,当然采取这种容灾方式的主要是资金实力较为雄厚的大型企业和电信级企业。
这种级别的备份根据实际要求和投入资金的多少,又可分为两种:
①两个数据中心之间只限于关键数据的相互备份;
②两个数据中心之间互为镜像,即零数据丢失等。零数据丢失是目前要求最高的一种容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和专用的硬件设备,需要投资相对而言是最大的,但恢复速度也是最快的。 以上两种热备份方式就不再是传统的磁带冷备份方式了,而是通SAN之类先进的通道技术,把服务器数据同步,或异步存储(镜像方式)在远程专用存储设备(也可以是磁带设备)上。
在以上两种热备份容灾方案中,主要的设备包括磁盘阵列、光纤交换机或磁盘机等。的是HP的一款低档磁盘阵列HP StorageWorks MSA1000,为一款高档虚拟磁盘阵列HP StorageWorks Virtual Array 7410产品。
IBM的一款企业级光纤交换机——TotalStorage® SAN 交换机 F32产品,它可提供32个光纤交换端口;而是一款中档光纤交换机——TotalStorage® SAN交换机F16,它可提供16个光纤交换端口。
三、异地容灾技术
在建立容灾备份系统时会涉及到多种技术,如:SAN或NAS技术、远程镜像技术、虚拟存储、基于IP的SAN的互连技术、快照技术等。
1. 远程镜像技术
远程镜像技术是在主数据中心和备援中心之间的数据备份时用到。镜像是在两个或多个磁盘或磁盘子系统上产生同一个数据的镜像视图的信息存储过程,一个叫主镜像系统,另一个叫从镜像系统。按主从镜像存储系统所处的位置可分为本地镜像和远程镜像。
远程镜像又叫远程复制,是容灾备份的核心技术,同时也是保持远程数据同步和实现灾难恢复的基础。远程镜像按请求镜像的主机是否需要远程镜像站点的确认信息,又可分为同步远程镜像和异步远程镜像。
同步远程镜像(同步复制技术)是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息,方予以释放。同步镜像使远程拷贝总能与本地机要求复制的内容相匹配。当主站点出现故障时,用户的应用程序切换到备份的替代站点后,被镜像的远程副本可以保证业务继续执行而没有数据的丢失。但它存在往返传播造成延时较长的缺点,只限于在相对较近的距离上应用。
异步远程镜像(异步复制技术)保证在更新远程存储视图前完成向本地存储系统的基本I/O操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息。远程的数据复制是以后台同步的方式进行的,这使本地系统性能受到的影响很小,传输距离长(可达1000公里以上),对网络带宽要求小。但是,许多远程的从属存储子系统的写没有得到确认,当某种因素造成数据传输失败,可能出现数据一致性问题。为了解决这个问题,目前大多采用延迟复制的技术,即在确保本地数据完好无损后进行远程数据更新。
2.快照技术
远程镜像技术往往同快照技术结合起来实现远程备份,即通过镜像把数据备份到远程存储系统中,再用快照技术把远程存储系统中的信息备份到远程的磁带库、光盘库中。
快照是通过软件对要备份的磁盘子系统的数据快速扫描,建立一个要备份数据的快照逻辑单元号LUN和快照cache,在快速扫描时,把备份过程中即将要修改的数据块同时快速拷贝到快照cache中。快照LUN是一组指针,它指向快照cache和磁盘子系统中不变的数据块(在备份过程中)。在正常业务进行的同时,利用快照LUN实现对原数据的一个完全的备份。它可使用户在正常业务不受影响的情况下,实时提取当前在线业务数据。其“备份窗口”接近于零,可大大增加系统业务的连续性,为实现系统真正的7×24运转提供了保证。
快照是通过内存作为缓冲区(快照cache),由快照软件提供系统磁盘存储的即时数据映像,它存在缓冲区调度的问题。
3.互连技术
早期的主数据中心和备援数据中心之间的数据备份,主要是基于SAN的远程复制(镜像),即通过光纤通道FC,把两个SAN连接起来,进行远程镜像(复制)。当灾难发生时,由备援数据中心替代主数据中心保证系统工作的连续性。这种远程容灾备份方式存在一些缺陷,如:实现成本高、设备的互操作性差、跨越的地理距离短(10公里)等,这些因素阻碍了它的进一步推广和应用。
目前,出现了多种基于IP的SAN的远程数据容灾备份技术。它们是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备援中心SAN中。当备援中心存储的数据量过大时,可利用快照技术将其备份到磁带库或光盘库中。这种基于IP的SAN的远程容灾备份,可以跨越LAN、MAN和WAN,成本低、可扩展性好,具有广阔的发展前景。基于IP的互连协议包括:FCIP、iFCP、Infiniband、iSCSI等。
4. 虚拟存储
在有些容灾方案产品中,还采取了虚拟存储技术,如西瑞异地容灾方案。虚拟化存储技术在系统弹性和可扩展性上开创了新的局面。它将几个IDE或SCSI驱动器等不同的存储设备串联为一个存储池。存储集群的整个存储容量可以分为多个逻辑卷,并作为虚拟分区进行管理。存储由此成为一种功能而非物理属性,而这正是基于服务器的存储结构存在的主要限制。
虚拟存储系统还提供了动态改变逻辑卷大小的功能。事实上,存储卷的容量可以在线随意增加或减少。可以通过在系统中增加或减少物理磁盘的数量来改变集群中逻辑卷的大小。这一功能允许卷的容量随用户的即时要求动态改变。另外,存储卷能够很容易的改变容量,移动和替换。安装系统时,只需为每个逻辑卷分配最小的容量,并在磁盘上留出剩余的空间。随着业务的发展,可以用剩余空间根据需要扩展逻辑卷。你也可以将数据在线从旧驱动器转移到新的驱动器上,而不中断服务的运行。
存储虚拟化的一个关键优势是它允许异质系统和应用程序共享存储设备,而不管它们位于何处。公司将不再需要在每个分部的服务器上都连接一台磁带设备。 SAN与NASNAS和SAN字面上相似,并且都是新型数据存储模式,但这二者是完全不同的,针对不同方向的技术。 什么是SAN(Storage Area Storage,存储区域网) SAN(Storage Area Storage,存储区域网)是一个高速的子网,这个子网中的设备可以从你的主网卸载流量。通常SAN由RAID阵列连接光纤通道(Fibre Channel)组成,SAN和服务器和客户机的数据通信通过SCSI命令而非TCP/IP,数据处理是“块级”(block level)。示意图如下: ![]() 什么是NAS(Network Attached Storage,网络附加存储) NAS(Network Attached Storage,网络附加存储)的典型组成是使用TCP/IP协议的以太网文件服务器,数据处理是“文件级”(file level)。你可以把NAS存储设备附加在已经存在的太网上。 ![]() SAN与NAS区别 区分SAN与NAS最简单的方法是想想二者在技术上是如何实施的。NAS通常是一个服务器群:应用服务器、邮件服务器等等,存储设备易于附加在这个系统上。SAN多部署与电子商务应用中,大量的数据备份和其它业务需要在网上频繁地存储和传输;SAN可以从你的主网上卸掉大量的数据流量,可以使你的以太网从数据拥塞中解脱出来。 目前存储市场主要有三种方式:DAS(Direct Attached Storage)、NAS(Network Attached Storage,网络附加存储)、SAN( 存储区域网)。传统的直接存储的模式DAS是直接将存储设备连接到服务器上,一方面,当存储容量增加时,这种方式很难扩展;另一方面,当服务器出现异常时,会使数据不可获得。NAS和SAN的出现适应了网络正成为主要的信息处理模式的发展趋势。IBM大中华区存储事业部总经理何国伟先生也认为,“未来的世界是网络存储世界,存储的外部化将是未来发展趋势,因此IBM存储的重点将放在SAN、NAS上”。 NAS简单灵活 NAS——网络附加存储,即将存储设备连接到现有的网络上,提供数据和文件服务。NAS服务器一般由存储硬件、操作系统以及其上的文件系统等几个部分组成。简单的说,NAS是通过与网络直接连接的磁盘阵列,它具备了磁盘阵列的所有主要特征:高容量、高效能、高可靠。NAS将存储设备通过标准的网络拓扑结构连接,可以无需服务器直接上网,不依赖通用的操作系统,而是采用一个面向用户设计的、专门用于数据存储的简化操作系统,内置了与网络连接所需的协议,因此使整个系统的管理和设置较为简单。其次NAS是真正即插即用的产品,并且物理位置灵活,可放置在工作组内,也可放在其他地点与网络连接。因此,用户选择NAS解决方案,原因在于NAS价格合理、便于管理、灵活且能实现文件共享。 以IBM为代表的业界各大存储厂商纷纷推出NAS解决方案,IBM公司最新的NAS产品主要包括:NAS 200, NAS 300, NAS 300G。NAS 200塔式存储设备主要是针对需要大量高性价比存储设备的Internet服务提供商(ISP)和需要电子邮件存储或视频文件服务的客户;NAS 300的双引擎设计可以支持关键业务高可用性应用,如大型部门和小型企业中的应收帐户、工资支付或客户支持。NAS 300G网关则是业界第一种开放式NAS设备,能将LAN与SAN连接在一起,NAS 300G允许基于局域网的客户机和服务器与现有存储区域网(SAN)互操作,实现了SAN与NAS的统一。 在2001年存储展中,有一家专门做NAS存储的厂商AUSPEX也颇引人注目,AUSPEX始建于1987年,可称为NAS市场的创建者和领头羊,AUSPEX通过其专利技术——功能多处理结构(Founctional Multiprocessing)把文件服务功能的不同功能分解到不同的专用CPU上,借助专用OS为客户提供了大容量、高性能和高可靠的网络数据服务。其产品系列包括NS2000通用网络文件服务器、NAS3000系列,其中NAS 3010LPDA最大磁盘容量达12TB,可接入36GB和73GB的磁盘驱动器;NAS3010XR采用内嵌式SAN结构,可通过光纤通道接入SAN交换机,实现对SAN的存储管理。 SAN高效可扩 SAN——存储区域网络,即通过特定的互连方式连接的若干台存储服务器组成一个单独的数据网络,提供企业级的数据存储服务。 SAN是一种特殊的高速网络,连接网络服务器和诸如大磁盘阵列或备份磁带库的存储设备,SAN置于LAN之下,而不涉及LAN。利用SAN,不仅可以提供大容量的存储数据,而且地域上可以分散,并缓解了大量数据传输对于局域网的影响。SAN的结构允许任何服务器连接到任何存储阵列,不管数据置放在哪里,服务器都可直接存取所需的数据。 与NAS相比,SAN具有下面几个特点:首先SAN具有无限的扩展能力,由于SAN采用了网络结构,服务器可以访问存储网络上的任何一个存储设备,因此用户可以自由增加磁盘阵列、带库和服务器等设备,使得整个系统的存储空间和处理能力得以按客户需求不断扩大。另外,SAN具有更高的连接速度和处理能力。SAN采用了为大规模数据传输而专门设计的光纤通道技术,目前的传输速度为100Mbps,并会很快开发出传输速度为200Mbps和400Mbps的光纤通道交换机。 实现SAN的硬件基础设施是光纤通道,用光纤通道构筑的SAN,由3部分构成:存储和备份设备,包括磁带库、磁盘阵列和光盘库等;光纤通道网络连接部件,包括主机总线适配卡(HBA: Host Bus Adapter)和驱动程序、光缆(线)、集线器、交换机、光纤通道与SCSI间的桥接器(Bridge)等;应用和管理软件包括:备份软件、存储资源管理软件、设备管理软件。由上可以看出,在SAN解决方案中,除存储设备外,其关键部件就是网络连接部件——光纤交换机,目前在IBM、COMPAQ等各公司提供的SAN解决方案中,其光纤交换机大都由博科通讯公司(Brocade)、McDATA、Infrange、Qlogic、Vixel、Gadzoox等提供的。例如博科公司的产品包括了从8端口的入门级光纤通道交换机到128端口企业级交换机,最近推出的128端口的SilkWorm 12000核心Fabric交换机是第一个可提供1Gbps和2Gbps链路速度的第三代ASIC型号,可支持目前的2Gbps光纤通道模块和新兴的存储协议,如10Gbps光纤通道模块、Infiniband Fabric模块以及未来的IP/以太网模块等,还支持可实现存储虚拟化。McDATA的口号是提供从核心到边缘的企业解决方案,其产品系列覆盖从8端口ES-1000到ES-3016、ES-3032直到64端口的ED-6064导向器,并定位于高端应用,McDATA认为,所谓高端,一是支持的端口数多,另一点是产品具有99.999%的高可用性,保证在线数据的连续性。另外 McDATA也提供EFC MANAGER管理软件,实现对交换单元的集中管理。 存储市场的火爆及SAN市场的增长,使这些公司也纷纷从幕后走到了前台,博科、McDATA不仅在存储展上大出风头,而且还将在国内成立办事处,进一步提供技术、服务方面的支持,但博科、McDATA公司均表示,OEM及合作伙伴策略将不会改变。在网络存储技术方面,博科公司的技术总监许良谋先生表示,3-5年内光纤通道技术仍会是主流技术,但博科公司目前对iSCSI、Storage over IP、Infiniband等技术进行密切关注,并加大了研发力度。 NAS+SAN是存储方案的最佳选择 尽管有些人认为存储区域网络(SAN)与网络连接存储(NAS)体系的融合是一种硬性的组合,但这两种技术的融合正在积极发展。为了弄清两者之间的关系,让我们仔细分析一下这两种技术。 大家普遍认为,IT存储需求以一种跳跃式的速度增长。实际上,IT存储能力现在正以每年52%的速度提高(the Forrester Report, March 2001)。要使存储能力跟上存储需求的步伐,意味着不仅要不断增加新的物理硬件,还要创建新的架构来管理这些硬件设施。在当前的IT预算已经被大幅削减的情况下,这种双重需求通常是很要命的。幸运的是,我们已经开始脱离直接连结存储(DAS)模式。这种昂贵的存储模式需要给每个单独的服务器增加硬盘,但却不能提供真正意义上的网络存储负载分摊模式,它只是提高了基础设施成本。 网络连接存储(NAS)是一种可以接受的选择方案。它是一台功能强大的数据服务器,能在文件级别上处理数据。典型情况下,它通过专用以太网连结到已有的网络中。除非是在不同的网络结构上创建NAS混合构件,否则对NAS的安装和管理是相当容易的。 相比较而言,存储区域网络(SAN)要复杂一些,它把数据以块为单位进行管理,采用具有更高传输速率的光纤通道(Fibre Channel)连接方式和相关基础结构。它的设计和实现途径为它带来了更高的处理速度,而且,SAN还是基于自身的独立的网络。它允许数据流直接从主网络上卸载,并降低了请求响应时间。(或者换句话说,它极大地减少了主网络运行缓慢的时间,这一优势在数据备份期间尤其重要。) 尽管NAS相对来说显得过于简单,但对于一个需要公共文件系统(如,电子邮件服务器组)的服务器群来说,它是一种不错的选择。SAN的高速及其良好的扩展性使它更适用于电子商务应用,在这类应用环境中,大量终端请求访问少量数据,或者说大量终端共享少量数据。 所有的事情都能以相对简单的方式来解释,如果给某些人足够的时间和微小的激励,那么他们可能会把简单的事情弄得相当复杂。现在的存储业正是这样,人们急于将NAS和SAN技术融合起来。(这种看法可能过于偏激)。当然,这种融合存在其合理性。SAN提供速度,NAS提供由文件处理带来的协作性,它们的结合将是非常令人心动的。对SAN来说,点到点之间光纤通道的最大距离不得超过10km限度实在是一个缺陷,但这种缺陷可以被NAS的IP连结所弥补。这就是说,可以通过IP网络发送光纤通道命令(FC/IP)。(如果你研究过SCSI协议,你应该知道iSCSI正是以同样的方式来处理SCSI命令)。借助于10 Gigabit以太网技术,这种处理方法最终变成了现实。 但是也有一些令人沮丧的因素:虽然在Intel Developer Forum期间,融合NAS/SAN技术的呼声很高,但要实现这种融合可能需要一年半到两年的时间,而且这还要依赖于Intel 3GIO总线体系结构的成功实现。(3GIO的处理速度要比PCI-X快6倍,它将大大缓解服务器和工作站上处理大数据量时的瓶颈问题)。另外,在关注NAS和SAN的融合时,应参考一些正准备进行这方面融合的企业,(比如,Hitachi的Freedom NAS体系就非常有意思)。如果不关注这些,你2002购买的设备在2004年进行升级的时候就可能要完全丢弃。 |





gulibin
博客统计信息
热门文章
最新评论
友情链接

