存储器产品

当前位置:当前位置:主页 > 产品展示 > 存储器产品 > 存储器产品

存储高可用性解决方案

作者:admin 日期:2014-04-02 17:42 来源:未知

第1章 动态基础架构 -- 攻守兼备、智取未来
  由华尔街次贷危机所引发的金融风暴已经让全世界都感受到了它逼人的阵阵寒意,任何企业或机构都无法置身事外而独善其身,这正是一个优胜劣汰,“剩”者为王的历史关键阶段!通过变革来降低企业的成本,提高效率,增强企业的核心竞争力已经迫在眉睫。
  与此同时,危机中也正孕育着未来新的竞争格局。在严峻的挑战下,具有长远发展眼光和战略的企业已经不仅着眼于渡过眼前危机,更在为下一轮的腾飞做准备。这是一个不断应对变化,不断突破的动态历程。那些孤岛式存在、僵化、劳动密集型的基础架构,已经无法动态响应变化的业务需求,无法灵活支持业务的动态扩展,将会成为企业长远发展的绊脚石。
  事实上,IT系统已经演变为核心的生产平台、管理平台、沟通平台和运营平台……世界正变得互连互通,智能连接;IT 系统也已经不再单纯是企业的成本中心,更是帮助企业再塑竞争力的创新推动力。为了帮助企业更好的应对上述挑战, IT基础架构应具备帮助企业有效应对如下挑战的能力:
  日益提高的成本压力——IT资产利用率低,管理复杂、运行成本高,导致竞争力下降、 无法持续发展;
  更高的服务期望——越来越精明的客户希望从日益增多的资产、应用和服务获得更有优质的服务体验;
  管理和控制新风险和威胁——业务变革速度加快、传统基础设施面临前所未有的安全性、弹性和合规性挑战;
  充分利用不断出现的新技术——必须利用更加智能、更具适应能力的技术,例如云计算、虚拟化和Web 2.0来推动业务创新、提高效率和快速响应能力。
  IBM 动态基础架构(Dynamic Infrastructure,简称DI)作为 21世纪的业务架构的基石,它超越了数据中心,将视野延展到整个企业或机构,涵盖物理和数字资产、数据中心、开放式计算资源、业务流程、各种解决方案。其最大独特性在于能够灵活、快速地提供最佳的 IT 和业务服务。形成一个动态的基础架构,能及时响应变化的业务需求,灵活支持业务的扩展。让企业更接近客户,更迅速的进行业务决策。
  我们将从虚拟化、信息基础设施、业务弹性、高效节能、安全、服务管理、资产管理七个方面,帮您搭建智能且安全的动态基础架构,超越传统的数据中心,融合业务架构和 IT 架构,从而转型为灵活的服务交付体系,以有效地解决企业今天所面临的运营挑战并为未来带来突破性的机遇。
  通过动态基础架构系列解决方案能够帮助您:
  降低业务成本:不仅降低运作成本和复杂性,而且通过虚拟化、整合优化、和灵活采购实现突破性的运营效率和生产力提高,为新的投资释放资源;
  加强动态服务:以服务管理的方法迅速和动态地提供业务和 IT 服务。不仅保证现有服务的高可用性,而且持续满足客户对实时响应、动态接入等创新式服务的期望,提高企业服务交付能力;
  管理业务风险:不仅应对当前的安全、连续性和法规遵从挑战,为行业定制端到端的监管、风险管理和合规策略的解决方案,而且具备灵活性,可快速应对未来各种潜在风险。
  IBM动态基础架构能够帮助您真正的实现攻守兼备,智取未来——既着眼于当前控制成本,削减 IT 开支,度过危机,又放眼未来,动态响应变化的业务需求,从而帮助您把握更多的机会,赢得未来!
第2章 存储高可用性给业务连续运营提供保障
  2.1 为什么要构建存储高可用性解决方案
  随着社会的发展和科技的进步,企业越来越依赖于数据处理来进行业务运营,对IT系统的依赖性也随之增加。一旦数据由于某种原因丢失,就有可能造成整个组织在运营上的重大不便和经济损失,企业的信誉也将受到影响。如果核心数据丢失,严重时完全有可能造成整个企业的瘫痪。所以保证企业的业务连续运营及数据处理的高可靠性和高可用性,就成为所有 IT 人员在建设IT基础架构中首先要考虑的问题。
  显然,企业所面临的风险和挑战来自多方面:
  无法预知的IT硬件设备的损坏、断电、火灾、自然灾害、恐怖袭击等,造成数据丢失或业务的突然中断;
  系统人员误操作造成意外宕机或关键数据丢失,无法避免;
  手段频多的黑客攻击、病毒入侵、垃圾邮件、网络与系统的漏洞,造成网络瘫痪、系统崩溃;
  用户需要实时应用与访问机密、关键数据,向企业的服务提出更高的要求;
  行业与政府的标准与法规的不断变化,进一步增加了企业的压力与成本。
  信息是企业的最宝贵的资产之一;集中的数据备份、恢复和管理已经成为企业数据存储管理的重要任务。企业需要的是:? 数据与存储系统的高可用性,保证数据7X24小时的连续访问;
  将现有的存储技术集成,创造出一种更有效的数据存储管理,实现高效、高可靠性、低成本的数据管理;
  需要一套成熟度高,业内应用广泛的企业级软硬件整体解决方案;
  需要对企业现有的数据库、邮件系统、文件服务器以及各种应用系统进行集中化、自动化的基于策略的保护;
  易于IT部门日常的管理维护,界面友好,可操作性强;
  能够符合企业日后发展需求,对异构平台有很好的支持,可以满足将来远程数据灾备的需求;
  一旦发生灾难(洪水、地震、火灾等),或者人为灾难(用户失误、磁盘失效等)导致数据丢失或者业务中断时,能够快速、及时地恢复数据,保证业务的连续运行。
  2.2 存储高可用性解决方案简述
  IBM存储高可用性解决方案,通过IBM存储硬件及软件产品的结合,在两台或多台存储设备间进行数据镜像,或者在两台存储设备间进行不间断的数据复制,实现存储设备高可用,在数据存储方面提高您IT基础架构的整体可用性,进而保证您的业务运营的可持续性。
  IBM数据存储的高可用性解决方案主要有以下两种:
  操作系统级别的数据跨存储实时热备份方案 :通过AIX操作系统的 LVM(逻辑卷管理)技术,在两套磁盘存储设备间(DS8000/DS5000/DS4000)建立数据镜像从而实现高可用性。任何一个存储的突然宕机也不会对业务造成任何影响。
  存储级别的数据跨存储备份方案 :基于智能存储之间的数据同步功能,通过 Metro Mirror(同步的镜像模式)和 Global Mirror (异步的镜像模式)等磁盘数据复制技术,在两套同一系列的磁盘存储设备间(DS8000/DS5000/DS4000)建立数据复制关系从而实现高可用性。方案不消耗主机系统的资源,保证相关主机上的应用高效运行。
第3章 IBM存储高可用性解决方案介绍
  3.1 存储高可用性的内容
  我们先来分析一下,高可用性所覆盖的内容。
  首先,业务连续性由三级支撑构成。高可用性,扮演着其中最为基本的一级:
  高可用性(High Availability)
  要求容错的硬件、自动诊断以及故障隔离、预分析、冗余等。其中,冗余是其最核心的特征。
  数据复制(Data Replication)
  在同城、异地,或者同城及异地进行数据的有效复制
  数据恢复(Data Recovery)
  非计划停机时,进行保护和恢复,满足恢复点目标和恢复时间目标
  高可用性,是体现在系统的各个细节中。从一个典型的IT系统拓扑来看,它的主要实现层次如下图所示:

本地存储设备层次的高可用性,如图中蓝色虚线方框所示,主要从以下三方面考虑:
  冗余SAN网络
  SAN交换机冗余配置,主机光纤通道卡、存储光纤接口双配置,冗余连接等。这部分设计用于防范通道、接口和网络的单点故障。
  存储设备个体高可靠
  除普遍支持RAID保护技术外,目前的部分高端企业级存储,还采用全冗余设计、镜像缓存等技术来进行自身保护。这部分设计和使用,侧重在于保证存储设备单个个体内的数据安全。当存储设备出现全面故障,不能运转时,最多只能保证“数据不丢失”,不能支持“数据持续访问”。
  双存储设备
  如上图中红色虚线部分所示,配置双磁盘设备,存放双数据拷贝。保证在单个存储服务器出现故障时,首先实现数据不丢失,其次实现业务的连续运行。
  在这三方面中,冗余SAN网络、存储设备个体高可靠相对为人所熟悉,不再赘述。下面所谈的存储高可用性方案重点,将集中在“双存储设备”的环节上。
  3.2 存储高可用性方案的主要实现方式
  存储高可用性方案的主要实现方式:磁盘设备间数据镜像和磁盘设备间数据复制。

图:存储高可用性方案实现方式
  3.2.1 磁盘设备间数据镜像
  通过Power服务器的LVM(逻辑卷管理)技术,在两套IBM System Storage磁盘设备间(DS8000/DS5000/DS4000),建立数据镜像关系。两套存储设备同时处于活动状态。生产主机在写数据时,会同时写入两套磁盘设备中。该方式能够提供最佳的持续可用性;当一台存储设备出现整机故障时,由另一台存储设备独立工作,应用不会受到中断。
  这种双磁盘系统数据同步复制机制,是基于IBM主机系统和IBM存储系统相互配合的逻辑卷镜像方式(是AIX操作系统里LVM工具里的Mirror功能),是目前技术成熟度高、实施快速简便、行之有效的数据冗余方式。
  采用这种方式,业务和应用的数据存储系统通过LVM的Mirror功能进行磁盘存储系统之间的镜像,实现存储系统的高可用性,在此环境中,即使有一半的主机系统和一半的存储系统发生故障而不能正常工作,整个系统也不会发生瘫痪,仍旧可以继续运行,充满足客户对高可靠性和连续可用性的要求。
  采用LVM方案,用户不必改变现有环境,也不存在数据集中迁移的问题,而且业务系统保持同时在线;不存在系统接管、应用重新启动等问题,可以实现系统的平滑过渡。实施LVM方案,既可以在相同型号的IBM存储产品之间进行,也可以在不同型号的IBM存储产品之间进行。
  在实施IBM LVM的数据同步方案时,分别将磁盘系统A和磁盘系统B通过光纤HBA卡连接到SAN交换机上,主机会有效识别两套存储系统,但对于应用没有任何影响;在主机上,基于磁盘底层的LVM在两套磁盘系统之间建立镜像关系,实现数据同步。
  LVM可以提供操作系统级别的镜像(Mirroring)功能,即可以为一个存储块提供多份拷贝。该功能包含在逻辑卷管理中,具有以下特点:支持2~3份拷贝的镜像;可选择顺序(Sequential)和并行(Parallel)两种存取方式;读数据时可从先找到的拷贝处读取,加快访问速度;镜像功能在数据损坏时,能够从备份中(最多有3份备份)自动恢复,增强系统的可靠性。  为了实现数据的同步,可利用数据镜像功能,为已有的磁盘一上的生产数据添加一个拷贝,并将其镜像设备指定为磁盘二。正常工作模式下,数据的写入操作为,生产系统对磁盘一上本地数据的任何更新都实时在磁盘二上的数据得到更新,生产数据和备份数据的更新方式可以选择顺序方式或者并行方式,建议使用并行方式以增强整体性能;当生产存储系统发生故障时,生产无需停顿,生产主机利用备份的数据拷贝继续运行,因为两个系统间采取光纤直连方式,性能的影响可以忽略;当进行生产存储维修时,可断开镜像关系,当生产存储修复后,恢复数据镜像关系,数据重新在两份拷贝间同步。

图:LVM逻辑卷镜像架构图
  3.2.2 磁盘设备间数据复制
  通过Metro Mirror(同步的镜像模式),和Global Mirror(异步的镜像模式)等磁盘数据复制技术,在两套同一系列的IBM System Storage磁盘设备间(DS8000/DS5000/DS4000),建立数据复制关系。对于主机来讲,活动状态的存储设备只有一台。这台存储设备使用硬件复制技术和备份磁盘之间进行数据复制,保持两个存储设备上的数据一致。存储系统的数据复制对于主机来说是透明的。
  该基于智能存储设备实现的硬件级别的数据复制,无需占用主机设备的系统资源,但是要求生产中心和备份中心的存储设备的硬件平台相同,如果采用该种方案,除了要求生产中心和容灾中心的存储设备的平台性必须一致的限制外,该种方案还是具备其自身的优点,由于它是基于存储设备来实现整个系统的数据复制,因此,它对主机系统的资源没有消耗,可以保证相关主机上的应用高性能运行;另外,基于该种方案的数据复制系统在搭建数据链路时,普遍采用了基于FC 的光纤裸链路,不管是采用同步或异步的传输方式,其数据的传输性能可以得到保证。
  镜像模式是全面的容灾及业务连贯性策略的组成部分。对于重要数据推荐使用Metro Mirror模式,而对不十分重要的数据可以使用Global Mirror的混合方式。

镜像模式图示
  Metro Mirror用来将一个存储系统镜像到另一个已经超过距离范围的系统。它被用来在存储系统内部控制同步,因此对于主机应用服务器来说,它几乎是透明的。这项功能被用来提供数据可用性,并且是实现容灾及业务连贯性的关键技术。Metro Mirror模式可以对逻辑驱动器进行同步镜像。Global Mirror用于异步镜像,并包含写顺序一致性选项。
  Metro Mirror模式介绍:可在数十KM范围内实现生产点与容灾点的数据无丢失。
  同步远程拷贝(synchronous writes):来自主机的数据被写往本地连接的磁盘系统,该系统将数据转发给远地点连接的磁盘系统。只有当两个系统都拥有数据的拷贝以后,本地系统才会向主机返回一个I/O完成指示。同步远程拷贝能够在远地点提供最新的数据,但应用程序会因等待写I/O操作的完成而被延迟。Metro镜像模式能够提供最高等级的保护,其中主逻辑驱动器和备用系统都会保持最新的更新,但是对远程系统写操作的固有延迟会降低整个应用的性能。Metro 镜像模式用于主系统和备用系统间距离小于10公里的同步镜像,由于距离的限制这种方式也叫做“同城镜像(Metro Mirror)”。这种模式用于精确同步。

  Global Mirror 模式介绍:在保证数据一致性的同时,可以实现容灾点只比生产点的数据稍有延迟。
  异步远程拷贝(Asynchronous Write ):来自主机的数据被写往本地连接的磁盘系统,该系统立即向主机返回一个I/O完成指示。数据在很短的一段时间(在实际中通常在数秒钟到一分钟左右)以后被送往一个远程磁盘系统。异步远程拷贝对应用程序性能的影响最小,但远程磁盘系统在数据的更新程度上与本地系统相比会有一个延迟。

  单纯的异步拷贝由于线路距离较远等原因,本地磁盘和远地磁盘可能会有逻辑卷读写顺序上的差异。这种方式也叫做“全局拷贝(Global Copy)”。在全局拷贝(Global Copy)的情况下,比如本地磁盘系统提供给主机5个逻辑卷,某一时刻主机对这些逻辑卷发起了A,B,C,D,E,5个写盘请求,本地的磁盘系统的写顺序是A,B,C,D,E。但是由于线路等原因,远地的磁盘系统在接收写请求时,收到的顺序可能是A,C,B,D,E。写盘的顺序也是A,C,B,D,E。我们假设灾难发生在这5个写操作D,B的中间部分,那么这时远地的数据C很有可能是没有意义的,甚至是无理的。
  为了解决本地磁盘和远地磁盘可能存在的逻辑卷读写顺序的差异,IBM的磁盘系统提供带有一致性组的异步远程数据拷贝。在这种方式下,远地的磁盘系统会将先收到的写请求缓存起来(比如上面的数据C),等到它前面的数据(A,B)到达后,再按照顺序写盘。这种方式叫做“全局镜像(Global Mirror)”。见下图:

  存储高可用性实施方案总结:
  磁盘设备间数据镜像方式 :通过Power服务器的LVM(逻辑卷管理)技术,在两套IBM System Storage磁盘设备间(DS8000/DS5000/DS4000),建立数据镜像关系从而实现高可用性。
  磁盘设备间数据复制方式:通过Metro Mirror(同步的镜像模式),和Global Mirror(异步的镜像模式)等磁盘数据复制技术,在两套同一系列的IBM System Storage磁盘设备间(DS8000/DS5000/DS4000),建立数据复制关系从而实现高可用性。
  3.2.3 层叠式镜像技术
  两地三中心容灾解决方案介绍
  我们选用IBM的企业级存储系统DS8000,结合磁盘层叠式镜象技术(Metro Global Mirror)为您建立两地三中心容灾解决方案:在本地生产中心的DS8000存储相应的业务数据,通过 Metro Mirror模式将数据同步到同城备份中心的DS8000,可以实时保证数据的一致性。同时位于同城DS8000的同一份数据可以同异地远端的DS8000通过Global Mirror模式进行数据镜像,实现异地的数据备份及保护。

技术要点:
  同城范围镜像数据可以不丢失;
  异地镜像数据根据灾难情形,尽可能降低数据丢失机率;
  镜像网络中断恢复后,任意两站点之间可以通过增量方式实现再同步,无需重传;
  本地中心失效时,同城中心可保证RPO=0;
  城域 + 跨地域,异地中心典型RPO为 3-5s;
  生产中心应用系统响应时间只受本地的两个中心的距离影响。
业务价值:
  尽可能保障没有数据丢失影响;
  为多种应用和业务提供保护;
  为灾难后业务的恢复提供最好的数据基础;
  远距离备份,提高灾难抵抗能力;
  降低镜像网络成本。