存储备份类

当前位置:当前位置:主页 > 成功案例 > 存储备份类 > 存储备份类

存储灾难备份方案

作者:admin 日期:2014-05-06 17:12 来源:未知

IBM 存储灾难备份方案

 

灾难备份方案

1、灾难设计的目的

 
随着信息技术的发展,企业越来越依赖于数据处理来进行它的商业行为,保证它在业界的竞争力。数据处理的高可靠性和高可用性越来越成为关键。
 
如果企业发现数据丢失,业务的开展将变得极其困难,更为重要的是,企业将失去客户的信任以及一系列的企业赖以生存发展的市场。核心数据的丢失,严重时完全有可能造成整个企业的瘫痪。
 
尽管随着科学技术的发展,计算机系统的可靠性日益增加,像IBM的HACMP高可用集群多处理技术可以在局域网范围内解决大部分的硬件和软件引起的系统不可用问题,但是由地震、洪水、火灾、战争等天灾人祸或由于软硬件故障而使生产系统整体无法正常工作等情况所造成的损失依然可以轻而易举地摧毁企业赖以生成的IT系统。所以,在异地建立灾备中心对于极度依赖IT的企业便成了必然的选择。IBM提供了从数据级到应用级的灾难备份解决方案。其中数据级的方案采用PPRC。
传统的灾难恢复方法(如每天对重要文件进行磁带拷贝并将这些拷贝转移到远地点)仍然能够满足大部分公司的需要。不过,某些公司的需求已经证明了使用远程拷贝功能的必要,远程拷贝就是在一个远地点维护生产数据的一份最新拷贝。(远程拷贝也被称为远程镜像)。
 
业界有两种基本的基于磁盘系统的远程拷贝形式:
 
同步远程拷贝:来自处理器的更新被写往本地连接的磁盘系统,该系统将数据转发给远地点连接的磁盘系统。只有当两个系统都拥有数据的拷贝以后本地系统才会向处理器返回一个I/O完成指示。同步远程拷贝能够在远地点提供最新程度的数据当前值,但应用程序会因等待写I/O操作的完成而被延迟。
 
异步远程拷贝:来自处理器的更新被写往本地连接的磁盘系统,该系统立即向处理器返回一个I/O完成指示。更新在很短的一段时间(在实际中通常在数秒钟到一分钟左右)以后被送往一个远程系统。异步远程拷贝对应用程序性能的影响最小,但远程磁盘系统在数据最新性方面与本地系统相比会有一个延迟。
 
下面分别对两种方案中IBM ESS的实施方法加以介绍。
 
 
 

2、 数据级灾难备份方案PPRC

 
IBM的PPRC提供了实现灾难备份的方案基础。PPRC全称PeertoPeerRemoteCopy,是以存储为基础的、实时的、与应用无关的数据远程镜像功能。PPRC实现较为简单,是无数据丢失且具有完全恢复功能的的灾难恢复解决方案。
PPRC基于IBMESS企业存储服务器,通过光纤通道,以逻辑卷为基本单位,将本地ESS上的数据同步镜像到远端ESS上。
 
为在保证数据的即时性、完整性和系统性能之间的平衡,PPRC提供了多种工作方式。
 2.1   同步方式下:点对点远程拷贝(PPRC)是一种同步远程镜像工具,可用于相隔距离最多可达103公里的两个ESS系统中指定的逻辑卷。这一距离可以通过第三方提供的通道扩展器加以延长。ESS可以为所有连接的主机(包括HP-UX)支持PPRC功能。
PPRC将确保如果备份卷不能被更新,那么即使源卷更新成功,整个写操作也会返回失败---彻底保证源卷和目的卷的数据彻底一致。同步方式可以保证数据不会丢失,更重要的是数据的一致性在这种方式下能够得到很好的保证---数据的不一致意味着相关数据的丢失,此时数据库的数据安全机制无法保证数据的安全,严重时有可能造成数据库无法启动。
PPRC的同步实现机制如下图所示:
 
PPRC同步工作过程为:
 
1、应用程序将数据写入磁盘,在生产系统中的应用程序将数据写到生产系统的磁盘。
2、生产系统中的磁盘数据传输到备份的磁盘对每一个在生产系统的写操作都要将这个写操作送到备份磁盘。
3、备份机磁盘数据复制
备份磁盘复制生产系统数据。
4、将写完操作信息返给生产磁盘
当生产系统收到备份系统传回的已写信息之后,生产机的磁盘系统通知主机该写操作已完毕,在此之后生产系统应用继续执行。
在同步PPRC的建立的过程中,volume有不同的状态,以保证数据的完整性。

 
2.2 在异步工作方式下,PPRC能够在远端更新未完成的情况下,只要本地更新成功就可以向主机返回“写成功”信号。好处是:可以在主备机房之间数据链路带宽成为瓶颈时,采用异步方式可以不影响主机房生产系统的性能。坏处是:1、数据将有可能丢失;2、当异步同步不能最终成功完成的情况下,数据的一致性无法得到保证。所以当采用异步方式时,IBM强烈建议先采用IBMESS的快速拷贝功能FlashCopy备份需同步的数据,再进行数据同步。

2.1.1 ESS的Flashcopy的使用
ESS的FlashCopy提供一个“时间点”的拷贝服务功能,从源卷到目标卷快速地复制数据。逻辑拷贝通常可以在数秒时间内完成,然后就释放源卷,进行正常工作。而物理拷贝操作在后台进行。当物理拷贝进行过程中,拷贝和被拷贝数据都能被客户应用使用。
 
IBM ESS的FlashCopy支持两个选项,它提供NOCOPY选项来支持灾备应用需求。以下讨论了在移动灾备的应用环境中是如何使用这些选项的。
FlashCopy COPY 选项
 
对于第一类BOSS应用,需要实时生产数据的时间点物理拷贝,这样的应用示例包括日常重要卷的备份、日常报表生成、数据仓库和数据挖掘的应用等。FlashCopy COPY 选项能够在磁盘存储设备中产生一份生产数据的真实时间点拷贝。该选项可以满足以下的BOSS应用需求:
 
1. 在磁盘存储设备中保存生产数据的一份时间点拷贝的业务需求。这方面的例子是日常工作系统备份。
2. 生产数据的时间点拷贝将被多个应用重复使用,特别是对每日的结束处理和报表生成。
3. 生产数据的时间点拷贝将被某些统计分析类应用,如MIS或数据挖掘应用频繁使用。
无论是什么原因,只要需要生产数据的物理拷贝,就可以使用FlashCopy COPY选项来进行支持。对于该选项而言,所需要的磁盘空间容量是需要拷贝的源磁盘容量的总和。
下图对 FlashCopy COPY选项进行了说明,请注意,生产数据的一份真实拷贝是为其它的应用使用而产生,这些应用通常是后端办公MIS类应用,如报表生成和数据挖掘。 
 
 FlashCopy NOCOPY 选项
 
对于IBM ESS独有的NOCOPY功能,在异步灾备中有极大的作用。NOCOPY也需要实时生产数据的时间点拷贝,但并不需要真正的数据拷贝,即在FlashCopy完成以后不存在源数据的单独的物理拷贝。这一点可以通过FlashCopy NOCOPY 选项来实现。使用NOCOPY选项的应用通常不需要频繁访问被拷贝映像。  
NOCOPY 选项不需要所有的镜像磁盘空间,但是需要一些磁盘空间进行磁盘索引和写I/O缓存。所需磁盘空间的容量取决于FlashCOPY的使用时间(即从建立到删除的时间)和被拷贝卷的更新速度。
在异步灾备的方案。本地可以用Flashcopy的NOCOPY的选项进行时间点的COPY,保证数据的完整性,再用PPRC进行远程灾备。
3 、PPRC的实施
PPRC的实际连接方法:

以上是标准的实时备份方案示意图,UNIX主机等服务器通过SAN与IBM企业存储服务器ESS相连接,两台ESS之间通过ESCON通道实现PPRC---同步远程拷贝。受ESCON传输距离的限制,当主备机房的距离超过3公里时,需要加光纤延伸器。光纤延伸器之间传输为DWWM,界质为光纤。可以从多个不同的厂商购得,比如IBM2029FibreSaver、INRANGE的9801等。在光纤延伸器的帮助下,PPRC可以达到103公里的距离。
PPRC的实施有两种方法,可用控制终端的图形界面,或用主机上的脚本来调用,自动来完成。
COPY的图形界面:

 
3、 ESS 的PPRC 同EMC的SRDF的对比
EMC 的Symmetrix远程拷贝的缺点
 
Symmetrix支持通过一项作为可选功能的Symmetrix远程数据工具(SRDF)来连接Symmetrix系统。SRDF是处理器独立的(除了对AS/400服务器有特殊的硬件警告和软件要求)。SRDF支持以下三种基本模式。
 
●     同步模式
●     半同步模式。这一模式不能提供全部的异步模式在性能上的好处,但确实允许在某一给定的超卷上处理一个(远程)写请求的同时,以串行方式处理后续的读请求。
 
在发生灾难的情况下,某些更新(每一超卷最多一个)可能还没有被传送到远地点。由于缺少中心控制点,当应用跨多个Symmetrix系统时,如果出现故障,半同步模式显然不能保证数据的完整性。这就意味着为了确保数据的完整性,半同步模式要求给定应用所需要的所有依赖于写次序的数据都必须存储在同一逻辑地点的Symmetrix系统上。(这在实践中是有疑问的,因为Symmetrix的高速缓存中数据有丢失的危险,比如,这可能意味着数据库数据和日志数据同时丢失,从而不可能进行自动化的恢复)。但是,即使考虑到这一限制,数据完整性也不能得到全面的保护。考虑以下的情形,一个数据库更新请求被发送给一个超卷,而且控制权被迅速归还给应用程序。此时,相关的日志更新被发送给另一个超卷,SRDF试图将数据库更新发送给远程的Symmetrix系统,但这一努力因线路故障而失败。在重新进行发送之前,日志的更新通过另一条线路被发送并在数据库被更新之前到达Symmetrix系统。如果在此时发生灾难,则远程Symmetrix系统上的数据完整性将被破坏。
 
因此,为在SRDF半同步模式下保护数据的完整性,所有依赖于写次序的数据都必须存储在同一超卷上,而不仅仅是在同一Symmetrix系统上。
 
●     适应模式。这一模式能够提供比半同步模式更好的性能,但代价是在出现故障的情况下不能保护数据的完整性,即使依赖于写次序的数据都存储在同一Symmetrix系统上也仍是如此。因此,这种模式的使用仅限于受控的数据传输应用,不能用于以灾难恢复为目的的实时远程拷贝。
 
SRDF的“本地/校园”解决方案可以提供的Symmetrix系统之间的最大距离为66公里。SRDF的“扩展距离”解决方案可以使这一距离达到电信距离。
 
作为一个可选项,SRDF使连接Symmetrix的光缆(用于远程拷贝)能够与第三方的转换器相连,从而使数据可以通过IP网络进行传输。当客户拥有一个利用率较低的IP网络时,这一方式可能是有用处的。EMC常常指出这一方式更适用于特殊的用途,如一次性卷拷贝,但它不是为支持大通信量实时同步远程拷贝而设计的。
 
远程拷贝性能方面的考虑事项
 
ESS和Symmetrix的远程拷贝工具最初都将正在被写入的数据存储在本地和远程磁盘系统的高速缓存中,因此应用程序不必等待磁盘寻道和旋转而导致的机械延迟。这些数据在I/O完成指示被发送给主机的一段时间以后才会从高速缓存进入磁盘。同步远程拷贝的性能总是随着距离的增加因光的传播速度而下降,对于光纤来说每125英里的距离都会增加1毫秒的时间,相当于本地高速缓存寻找4KB数据的命中响应时间。
 
进行直接的性能对比是不容易的。每一磁盘系统都提供了不同模式的远程拷贝操作并实现了不同的优化。例如,ESS PPRC包含的一项优化可以减少本地和远程ESS系统之间协议的“握手”,而Symmetrix所支持的“远点”(“FarPoint")优化功能能够在某些情况下以批处理的方式将数据发送给目标系统。本文的作者到目前还不知道进行过任何比较ESS和Symmetrix远程拷贝性能的基准测试。
 
乍看起来,Symmetrix SRDF半同步模式与ESS PPRC同步模式相比似乎存在着潜在的性能上的优势,虽然前者在远地点的数据最新性和数据完整性方面付出了潜在的牺牲。但是在事实上,ESS PPRC具有在消除半同步模式其他缺陷的情况下超出SRDF半同步模式的潜力。
 
考虑基本的SRDF半同步性能:对逻辑卷的“第一次”写操作进行的模式与发出这一指令的应用程序相比是异步的,这就意味着一个I/O完成指示将被迅速发往服务器,而不必等待远程Symmetrix系统被首先更新完毕。这样,就可以在第一次写操作正在进行的同时允许对同一逻辑卷进行后续的读操作。在SRDF完成第一次写操作之前对同一逻辑卷的其他写操作将被延迟,直至第一次写操作处理完毕。
 
半同步模式的主要好处可能是能够减少后续读请求可以得到处理之前的等待时间。如果应用程序仅发出一次读请求,而且在以后的一段时间内没有对同一逻辑卷发出其他的I/O请求,则这一模式在总体响应时间方面的好处是可以忽略不计的。而且,正如EMC所指出的那样,一个写请求密集的应用程序发出写请求的速度是如此之快,以至于在SRDF完成第一次写操作之前就已经发出了第二次写请求,在这种情况下,“第二次写请求将不会被接受”,因此对第二次写请求来说SRDF模式几乎没有带来什么好处。
 
如果负载是一个在发出一个写请求后一收到磁盘系统返回的写I/O完成信号就向逻辑卷发出一个或多个读请求的单一应用(过程或任务),则半同步模式确实优于同步模式,能够以更快的速度发出上述读I/O请求。但是,如果负载比较繁重而且有一个或多个应用程序在同一时间里访问同一逻辑卷(不必是同一文件或数据库),则在同一时刻会出现多个未完成的读或写I/O请求,在这种情况下ESS的同步PPRC会表现出以下的优势:
 
ESS在中型环境中能够为SCSI指令标签队列提供全面的支持,也能够为OS/390加速器(如并行访问卷和多效)类似的支持(到目前为止这种支持还是排他性的),这样PPRC中的I/O操作就可以实现在SRDF半同步模式中不可能实行的并行性。现在考虑如果由PPRC来处理前面讨论过的SRDF半同步过程会出现什么情形,收到对逻辑卷的第一次写请求后,与半同步模式不同的是,在PPRC中只有在本地和远程ESS系统都得到更新以后应用程序才会收到一个I/O完成信号。不过,ESS可以立刻接受来自同一应用或其他应用的对同一(或不同)逻辑卷的读写请求,并以并行方式处理这些请求,而不必等待第一次写操作的完成。例如,ESS的数据条纹化功能最多可以允许八个在高速缓存中没有得到所需数据的读I/O请求以并行方式访问同一逻辑卷,而SRDF一次仅能允许一个13。
 
出现这一结果的原因是ESS内部拥有全面的性能(增强)工具,这些工具不仅可被用于正常的处理过程,也可以被用于远程可被处理过程,在很多种情况下ESS都可以获得或超过SRDF半同步模式所具备潜在的性能上的长处,与此同时,还不会出现半同步远程拷贝模式所特有的复杂性以及在远地点丧失数据最新性和数据完整性的潜在风险。
 
多中继远程拷贝
 
根据到目前为止所进行的有关远程拷贝的讨论,在应用程序所受到的影响最小化以及保证数据完整性的前提下,在任意距离分隔开的磁盘系统之间实现最大程度的数据最新性是一项很明显的技术上的挑战。为实现这一目标,ESS和Symmetrix都实行了被EMC称为“多中继”的配置。
 
在典型情况下,这样的配置涉及到三个磁盘系统-A、B和C,其3工作方式如下,A是本地磁盘系统,C是远程目标(恢复)系统,B是位于A和C之间的中间磁盘系统。
 
系统A通过同步远程拷贝协议(ESS PRRC或Symmetrix SRDF同步模式)与B进行远程拷贝会话。系统A与系统B之间的距离必须使应用程序的性能保持在可接受的范围内。在系统A发生“灾难”以后,系统B 中将包含最新的数据,而且系统B将会把这些数据拷贝到系统C。因此,系统C的恢复必须等待系统B将最新的数据发送给自己,那时系统C将拥有与系统B相同的数据,就如同一直在与系统A进行同步远程拷贝会话一样。
 
ESS FlashCopy或Symmetrix TimeFinder都可以在系统B中使用,用于在系统A与B之间拷贝会话进行的同时定时制作将被发送给系统C的数据拷贝。最后,系统C将获得一份稳定的时间点数据拷贝,可以在系统A的数据出现错误(这些错误可能被传送到系统B)时提供保护;系统B或C中的数据拷贝也可以被当地的其他应用程序使用。
 
与磁盘镜像相比,ESS RAID 5可以减少多中继配置中所需要的磁盘的数量。
 
其他考虑
 
ESS和Symmetrix都允许将内部复制与远程拷贝结合起来。例如,生产卷的一个远程拷贝本身可以在目标系统内被复制,而且这一复制的拷贝可用作一个备份任务的数据输入。
 
对于某些服务器,可以通过驻留在主机的软件包来提供利用IP网络进行的远程镜像功能。(例如,IBM的HAGEO和GeoRM产品能够为AIX操作系统提供远程拷贝支持;Legato的Octopus产品可以为Windows NT平台提供远程拷贝支持)。这些软件包通常是不依赖于磁盘系统。
上一篇:案例 下一篇:云计算平台详细设计方案