选择在数据备份或恢复操作中要使用的资源

申请号 CN201280076174.5 申请日 2012-08-31 公开(公告)号 CN104685475A 公开(公告)日 2015-06-03
申请人 惠普发展公司; 有限责任合伙企业; 发明人 M.纳尼瓦德卡; S.米斯拉;
摘要 在各种实施方式中描述了用于选择在数据备份或恢复操作中要使用的资源的技术。实施这些技术的示例方法可以包括使用计算系统确定与可用于在数据备份或恢复操作中使用的多个候选资源相关联的诊断信息。该方法还可以包括使用该计算系统从该多个候选资源中选择推荐资源,该推荐资源至少部分地基于该诊断信息来选择。该方法还可以包括使用该推荐资源来使得数据备份或恢复操作得以施行。
权利要求

1.一种用于选择在数据备份或恢复操作中要使用的资源的方法,所述方法包括:
使用计算系统确定与可用于在数据备份或恢复操作中使用的多个候选资源相关联的诊断信息;
使用所述计算系统从所述多个候选资源中选择推荐资源,所述推荐资源至少部分地基于所述诊断信息而被选择;以及
使用所述推荐资源使得所述数据备份或恢复操作得以施行。
2.权利要求1所述的方法,其中,选择所述推荐资源包括基于所述诊断信息确定用于所述多个候选资源中的每个的可靠性度量,并且基于所确定的可靠性度量选择所述推荐资源。
3.权利要求2所述的方法,其中,确定用于所述多个候选资源中的每个的可靠性度量包括根据规则集来组合与多个相应诊断参数相关联的值和与所述多个相应诊断参数相关联的对应权重。
4.权利要求1所述的方法,其中,选择所述推荐资源包括确定与包括在所述诊断信息中的至少一个诊断参数相关联的历史趋势信息,并且至少部分地基于所述历史趋势信息选择所述推荐资源。
5.权利要求4所述的方法,其中,所述历史趋势信息被用来确定所述多个候选资源中的至少一个的潜在失效。
6.权利要求5所述的方法,进一步包括使得存储在所述多个候选资源中的所述至少一个上的数据得以拷贝到另一资源。
7.权利要求5所述的方法,进一步包括使得通知得以生成,所述通知指示所述潜在失效。
8.一种用于选择备份目的地设备的系统,所述系统包括:
多个候选备份目的地设备,其可用于在数据备份操作中使用;
在通信地耦合到所述多个候选备份目的地设备的计算系统的处理器上执行的资源选择代理,所述资源选择代理被配置成确定与所述多个候选备份目的地设备相关联的诊断信息,并且至少部分地基于所述诊断信息从所述多个候选备份目的地设备中选择推荐备份目的地设备。
9.权利要求8所述的系统,其中,所述资源选择代理基于所述诊断信息确定用于所述多个候选备份目的地设备中的每个的可靠性度量,并且基于所确定的可靠性度量选择所述推荐备份目的地设备。
10.权利要求9所述的系统,其中,确定用于所述多个候选目的地设备中的每个的可靠性度量包括根据规则集来组合与多个相应诊断参数相关联的值和与所述多个相应诊断参数相关联的对应权重。
11.权利要求8所述的系统,其中,所述资源选择代理确定与包括在所述诊断信息中的至少一个诊断参数相关联的历史趋势信息,并且至少部分地基于所述历史趋势信息选择所述推荐备份目的地设备。
12.权利要求11所述的系统,其中,所述资源选择代理基于所述历史趋势信息确定所述多个候选备份目的地设备中的至少一个的潜在失效。
13.权利要求12所述的系统,其中,所述资源选择代理使得存储在所述多个候选备份目的地设备中的所述至少一个上的数据得以拷贝到另一设备。
14.权利要求12所述的系统,其中,所述资源选择代理生成指示所述潜在失效的通知。
15.一种存储指令的非瞬时性计算机可读存储介质,所述指令当被处理器执行时使得所述处理器:
确定与可用于在数据备份或恢复操作中使用的多个候选资源相关联的诊断信息;以及从所述多个候选资源中选择推荐资源,所述推荐资源至少部分地基于所述诊断信息而被选择。

说明书全文

选择在数据备份或恢复操作中要使用的资源

背景技术

[0001] 许多公司在数据保护上设置高优先级。在商业世界中,公司收集和使用的数据通常是该公司最重要的资产,并且甚至相对少的数据丢失或数据中断也可以具有重大影响。此外,通常需要公司以遵守各种数据保护规章的方式来防护其数据。作为结果,许多公司在数据保护和数据保护对策方面已经进行了可观的投入。
[0002] 作为数据保护对策的一个部分,许多公司对其数据的部分或全部施行备份。可以在按需基础上执行数据备份,但是更通常地其被调度以在循环基础上(例如,按夜、按周,等等)进行执行。这样的数据备份可以服务不同的目的。例如,一个目的可以是允许还原已经丢失或损坏的数据。另一目的可以是允许还原来自较早前时间的数据——例如,以恢复先前版本的文件和/或以恢复最后一次已知的正确配置。附图说明
[0003] 图1示出了示例备份环境的概念图
[0004] 图2示出了用于选择在数据备份或恢复操作中要使用的资源的示例过程的流程图
[0005] 图3示出了示例系统的框图

具体实施方式

[0006] 备份系统可以通过将数据存储在永久性目的地存储装置中来例如在数据中心中保护至关重要的数据。目的地存储装置可以包括单个或多个类似或不同存储类型的存储设备,诸如磁带设备、磁带库,或盘设备(本地的和/或基于网络的)。在一个时间段内或者随着一定数量的使用,存储设备和/或相应的存储介质的可靠性可能开始降低,并且这些设备或介质可能开始以低于最优平进行操作。在一些情况下,这些设备或介质可能甚至发生失效。这可以潜在地导致重要数据的丢失。
[0007] 根据此处描述的技术,备份系统可以基于指示可用于在操作中使用的设备和/或存储介质的可靠性的诊断信息来标识用于在备份或恢复操作中使用的设备和/或存储介质。这样的技术可以提升这样的备份或恢复操作将成功完成的机会,并且可以有助于确保充分地保护机构的重要数据。
[0008] 在一个示例实施方式中,备份系统可以分析与可用于在备份操作中使用的数个候选盘设备相关联的读取错误率、重分配扇区计数、旋转重试计数、命令超时,和/或其他诊断参数,并且可以选择要用于所述操作的特定盘设备(例如,被认为是最可靠的盘设备,或者满足可靠性阈值水平的盘设备)。作为另一示例,备份系统可以分析与可用于在备份操作中使用的数个磁带设备相关联的通电小时、读取和/或写入裕量、头部寿命百分比,和/或其他诊断参数,并且可以选择要用于所述操作的特定磁带设备。在其他示例中,可以分析与在数据备份或恢复操作中要使用的其他资源相关联的各种适当的诊断参数,所述在数据备份或恢复操作中要使用的其他资源包括例如盘设备所使用的网络共享、诸如装载/卸载机制之类的磁带库组件,以及介质本身(例如,磁带介质或其他适当的介质)。
[0009] 在一些实施方式中,用于选择在数据备份或恢复操作中要使用的资源的方法可以包括使用计算系统确定与可用于在数据备份或恢复操作中使用的多个候选资源相关联的诊断信息。这些候选资源可以包括一组可用存储设备、一组可用存储介质,或者两者。该方法还可以包括使用该计算系统从该多个候选资源中选择推荐资源,该推荐资源至少部分地基于该诊断信息来选择。例如,该计算系统可以选择其认为候选资源中最可靠的作为推荐资源。该方法还可以包括使用推荐资源来使得数据备份或恢复操作得以施行。
[0010] 可以使用此处描述的技术例如来提高特定备份或恢复操作将成功的机会。在一些情况下,这些技术还可以减少用于备份操作的时间量,因为失效作业的数目可以降低,这继而可以减少确保保护某些数据所需的重调度备份操作的数目。还可以使用这些技术来主动地将“处于危险中的”数据迁移到更可靠的数据存储装置。根据图并根据随后的描述,这些和其他可能的益处和优点将是清楚的。
[0011] 图1示出了示例备份环境100的概念图。环境100可以包括多个数据源102a、102b和102c,并且还可以包括多个备份设备104a、104b和104c。可以经由备份管理计算设备110将多个数据源102a-102c通信地耦合到多个备份设备104a-104c,所述备份管理计算设备110可以被配置成控制和管理备份/恢复过程。可以通过一个或多个适当网络将各种计算设备进行互连。环境100的示例拓扑可以提供代表各种备份环境的数据备份能。然而,应当理解的是,该示例拓扑仅用于说明性目的而被示出,并且可以对该配置进行各种修改。例如,备份环境100可以包括不同或附加的组件,或者这些组件可以以不同于所示出的方式的方式进行连接。
[0012] 数据源102a-102c不需要全部是同一类型。实际上,在许多环境中,数据源102a-102c在类型方面将通常发生变化。例如,在企业环境中,数据源102a-102c可能采取数据库服务器集群、应用服务器、内容服务器、电子邮件服务器、台式计算机、膝上型计算机等等的形式。类似地,备份设备104a-104c在类型方面可以发生变化。例如,备份设备
104a-104c可以包括盘设备、磁带设备,和/或磁带库。也可以使用其他适当类型的备份设备。
[0013] 在一些环境中,源代理组件可以在数据源102a-102c中每个上执行,并且介质代理组件可以在备份管理计算设备110上执行。源代理组件可以负责从如在备份策略中指定的主机设备读取数据。要备份的数据可以包括特定文件、文件系统、数据库、电子邮件/文件/web服务器,或者任何其他适当类型的数据。介质代理组件可以负责从源代理组件接受数据并且将其写入到目的地备份设备和/或备份介质。在所示的示例中,数据源102c正在经由备份管理计算设备110发送要备份到备份设备104b的数据。
[0014] 在一些实施方式中,源代理组件本身可以负责将数据直接写入到备份设备,而不是经由备份管理计算设备110来路由数据。在这样的情况下,主机计算设备可以包括用于按照此处描述的技术自动地选择适当的备份设备的功能。类似地,在这些或其他实施方式中,源代理组件和介质代理组件可以独立于中央备份管理实体,并且可以例如通过备份/恢复图形用户接口(GUI)来独立地控制和管理这些代理。
[0015] 如所示的,备份管理计算设备110可以包括处理器112、存储器114、接口116、资源选择器118、诊断仓库120和规则集仓库122。应当理解的是,此处所示的组件用于说明性目的,并且在一些情况下,可以由一个或多个不同或附加的组件来施行关于特定组件所描述的功能。类似地,应当理解的是,可以将所述功能的部分或全部组合成比所示出的更少的组件。
[0016] 处理器112可以被配置成处理供备份管理计算设备110执行的指令。可以将这些指令存储在非瞬时性有形计算机可读存储介质上,诸如存储器114中或单独的存储设备(未示出)上,或者存储在存储指令的任何其他类型的易失性或非易失性存储上,以使得可编程处理器施行本文描述的技术。替换地或附加地,备份管理计算设备110可以包括专用硬件,诸如一个或多个集成电路专用集成电路(ASIC)、专用特殊处理器(ASSP)、现场可编程阵列(FPGA),或者前述专用硬件示例的任何组合,以用于施行本文描述的技术。在一些实施方式中,可以视情况使用多个处理器连同多个存储器和/或多个类型的存储器。
[0017] 可以以硬件和/或软件来实施接口116,并且可以将其配置成例如接收所请求的备份或恢复操作并且对所请求的备份或恢复操作进行响应。例如,可以将接口116配置成从数据源接收备份策略和要备份的数据,并且可以将其配置成将要备份的数据转发到适当的备份设备。
[0018] 在备份操作中要使用的备份设备可以在例如备份策略中进行指定,或者可以由备份管理计算设备110按照此处描述的技术进行选择。例如,基于GUI的策略可以允许用户指定在备份操作中要使用的特定设备和/或介质,或者选择用于优选具有较好可靠性特性的备份资源的选项,使得系统自动地选择用于在备份操作中使用的适当资源。
[0019] 在其中指定了特定备份设备或介质的情况下,可以使用所指定的资源来执行备份操作。在其中要选择适当资源的情况下,备份策略也可以指示可用于选择的一系列备份设备和/或介质。可以例如由资源选择器118将可用的设备和/或介质认为是用于在特定备份操作中使用的潜在候选者。
[0020] 资源选择器118可以在处理器112上执行,并且可以被配置成确定与多个候选备份设备相关联的诊断信息。例如,资源选择器118可以查询诊断仓库120以标识已经存储的关于候选备份设备和/或备份介质的诊断信息。尽管诊断仓库120被示出为备份管理计算设备110的组件,但是应当理解的是,该仓库可以与备份管理计算设备110相分离地进行存储和/或维持。例如,可以使用环境100中的单独的计算设备来集中地存储和/或维持诊断仓库120,使得多个备份管理计算设备可以共享单个诊断仓库120。资源选择器118还可以或替换地查询候选备份目的地设备以请求与特定设备相关联的诊断信息。
[0021] 可以维持诊断仓库120以包括关于个体备份目的地设备和备份介质的当前和历史诊断信息。在一些情况下,诊断仓库120可以将用于设备和/或介质的全部或子集的信息存储在给定的数据中心中。可以例如通过相关联的供应商标识符、产品标识符、序列号,和/或设备类型,或者通过另一适当的标识符或标识符的组合,来在诊断仓库120中唯一地标识每个备份设备和/或备份介质。维持在诊断仓库120中的诊断信息可以包括数个不同诊断参数,以及与那些参数相关联的当前和/或历史值。在一些实施方式中,这些诊断参数可以包括自监视、分析和报告技术(S.M.A.R.T)协议中所包括的某些参数或参数的组合。在一些实施方式中,这些诊断参数还可以或替换地包括其他标准的或专有的诊断信息。也可以按照各种实施方式来监视诸如性能相关的参数之类的其他参数并将其维持在诊断仓库120中。
[0022] 与备份设备和/或介质相关联的特定诊断参数可以根据设备类型或介质而发生变化。例如,与盘设备相关联的某些诊断参数可能在磁带设备的上下文中不适用,并且反之亦然。与盘设备相关联的一些示例诊断参数可以包括例如读取错误率、重分配扇区计数、旋转重试计数、命令超时、不可校正扇区计数、通电小时,等等。在基于网络的盘设备的情况下,其他示例诊断参数可以包括例如网络接口卡诊断信息(NIC错误或读取/写入错误)和/或网络吞吐量或其他可靠性参数。
[0023] 与磁带设备相关联的一些诊断参数可以包括例如通电小时、读取裕量、写入裕量、头部寿命百分比、复位寿命百分比、装载/卸载寿命百分比、所需清扫频率温度信息历史、驱动性能号历史、磁带装载失效历史、读取/写入错误,等等。在磁带库的情况下,其他示例诊断参数可以包括例如装载/卸载失效、库存磁带数目,和/或与机器人控制器相关联的诊断信息。与磁带介质相关联的一些诊断参数可以包括例如介质盒磨损信息、磁带已经重新格式化的次数、磁带龄期,等等。
[0024] 也可以连同上文描述的诊断参数,将某些观测值(例如,用于具有特定设备的特定备份会话的读取/写入性能,和/或用于特定备份会话的读取/写入错误的数目)存储在诊断仓库120中。也可以将这样的观测值用于按照此处描述的技术来选择备份设备或介质。
[0025] 在一些实施方式中,在备份或恢复操作开始之前,备份管理计算设备110可以查询任何候选备份设备和/或介质以利用与那些设备和/或介质相关联的最近的诊断参数来更新诊断仓库120。例如,在磁带设备的情况下,可以从设备中存在的SCSI日志页面中检索诊断参数;或者,在盘设备的情况下,可以通过在盘设备上执行适当的SCSI/ATI命令来从该设备中检索诊断参数。如果诊断仓库120中还没有包括特定设备或介质,则可以将其视情况连同任何相关联的诊断参数添加到仓库中。如果诊断仓库120中已经包括该特定设备或介质(例如,如与唯一标识符相关联地进行标识的),则可以更新与该特定设备相关联的诊断信息。
[0026] 可以将资源选择器118配置成至少部分地基于诊断信息从多个候选资源中选择推荐的备份资源(例如,设备或介质)。对于推荐备份资源的选择可以基于一个或多个可配置规则集,其可以存储于规则集仓库122中。在一些实施方式中,这些规则集可以定义与某些诊断参数相关联的权重(例如,基于特定实施方式中给定参数的相对重要性),并且还可以定义要如何组合这些诊断参数的加权值。例如,可以将这些规则集配置成计及给定参数的重要性以及确认:对于某些参数而言,较低的值指示较好的可靠性,而对于其他参数而言,较高的值指示较好的可靠性。
[0027] 可以将这些规则集用来确定指示给定资源的预期可靠性或健康的一个或多个可靠性度量(例如,得分或一组得分)。例如,资源选择器118可以组合与相应候选资源相关联的一部分加权诊断参数或全部加权诊断参数以计算用于候选资源中的每个的可靠性得分。然后,可以将具有指示最高可靠性的得分(例如,最高或最低得分)的后续资源选取为用于在备份或恢复操作中使用的推荐资源。在一些实施方式中,可以确定多个可靠性度量(例如,每个对应于不同类别或子类别的可靠性)。不同的度量可以导致不同的推荐资源,每个推荐资源可以适合于特定操作。在这样的实施方式中,可以将多个推荐资源呈现给用户以供选择,或者可以将规则集用来确定应当使用资源中的哪一个。
[0028] 还可以将资源选择器118配置成在选择用于在备份或恢复操作中使用的推荐资源时考虑历史或趋势性诊断信息。例如,即使诊断参数的当前值在可接受范围内(指示合适的可靠性水平),对用于该特定参数的历史趋势的分析也可能指示这些值正趋向不可接受的范围。在这样的情况下,资源选择器118可以相对于正趋向不可靠性的资源而偏爱未正趋向不可靠性的资源。例如,如果写入错误率(对于盘设备而言)或者写入裕量(对于磁带设备而言)已经表明在过去的几个备份会话内的负面趋向,那么可以不推荐这样的设备用于备份操作。这样,选择推荐资源可以包括确定与至少一个诊断参数相关联的历史趋势信息,并且至少部分地基于历史趋势信息来选择推荐资源。
[0029] 在一些情况下,历史趋势信息可以指示特定资源的失效是可能的或者甚至很可能的。例如,如果错误相关的参数开始低,但随后随着时间推移稳定地增加(例如,指示资源正变得不太可靠),并且趋势信息表明错误率的突然增加,则可以预期在不久的将来发生失效。即使参数的当前值仍然在可接受范围内(这单独地看将被认为是可靠的),也可以标识这样的潜在失效。在其中确定了潜在失效的这样的情况下,资源选择器118可以使得通知被生成以指示该潜在失效。然后可以将通知提供给管理员,该管理员可以采取适当的动作。
[0030] 当确定资源对于将来的备份或恢复操作而言不再可靠时,备份管理计算设备110还可以指示应当将不可靠资源所处理的数据拷贝到其他地方以缓解可能的数据丢失。在这样的情况下,备份管理计算设备可以自动地触发将处于危险中的数据的拷贝存储在更可靠的资源上。
[0031] 在一些情况下,备份策略可以提供可以被用来进一步定义资源选择器118所使用的选择参数的数个选择准则。备份策略提供的这些选择准则可以基于正进行选择的资源的类型。例如,在选择盘设备用于在备份或恢复操作中使用的情况下,备份策略可以指定诸如在推荐特定盘设备时是否忽略吞吐量设备性能号和/或设备温度值之类的选项,或者也可以或替换地指定是否可以推荐具有坏/不稳定扇区的设备。作为另一示例,在选择磁带设备以供使用的情况下,备份策略可以指定是否可以推荐具有清扫所需的信号驱动器,并且还可以或替换地指定读取裕量百分比阈值、写入裕量百分比阈值、头部寿命百分比阈值,等等。在其他示例中,也可以或替换地将与磁带库有关的选择参数(例如,机器臂参数)、网络状况(例如,网络接口和吞吐量参数)或其他可靠性参数配置在备份策略中。类似地,也可以将与介质有关的选择参数(例如,读取/写入错误阈值等等)配置在备份策略中。这些和/或其他可靠性相关的参数可以经由图形用户接口而呈现给用户,并且其可以以任何适当的组合进行选择和/或指定。
[0032] 尽管已经使用环境100来描述选择在备份操作中要使用的备份设备或介质,但是在恢复操作的上下文中也可以使用类似的技术。例如,在一些情况下,可以将数据备份到数个不同备份设备和/或介质,并且可以使用这些数据备份中的任一个来完成对于这样的数据的恢复。在这样的情况下,可以将此处描述的技术用来(从其中备份了数据的多个资源中)选择在恢复操作中要使用的推荐资源。如在备份上下文那样,可以基于与候选资源相关联的诊断信息来选择用于恢复操作的推荐资源,并且可以选择“最合适”或“最可靠”的资源以用于在恢复操作中使用。类似地,可以将这些技术应用于存档解决方案、重复数据删除解决方案的上下文中,或其中某些备份设备和/或介质的可靠性随着时间推移可能已经劣化的任何其他适当的上下文中。
[0033] 图2示出了用于选择在数据备份或恢复操作中要使用的资源的示例过程200的流程图。可以例如由诸如图1中所图示的备份管理计算设备110之类的备份管理系统来施行该过程200。为了呈现的清楚性起见,后面的描述使用备份管理计算设备110作为用于描述该过程的示例的基础。然而,应当理解的是,可以将另一系统或系统的组合用来施行该过程或该过程的各种部分。
[0034] 过程200开始于210,其中确定与多个候选资源相关联的诊断信息。例如,备份管理计算设备110可以查询当前和/或历史诊断信息的仓库来标识与该多个后续备份设备和/或备份介质中的每个相关联的诊断信息。
[0035] 在块220处,基于诊断信息选择推荐资源。例如,备份管理计算设备110可以从在施行数据备份或恢复操作时要使用的多个候选资源中确定最可靠的资源。可以通过确定用于多个候选资源中的每个的可靠性得分来确定可以将这些资源中的哪个认为是最可靠的资源,具有最高(或最低)得分的候选资源被认为最可靠。可以例如根据可配置规则集和/或GUI策略,基于当前和/或历史诊断信息来确定可靠性得分。
[0036] 在块230处,备份管理计算设备110可以使用推荐资源使得备份或恢复操作得以施行。例如,在备份操作的情况下,可以将推荐备份设备和/或介质用来存储要备份的数据。在恢复操作的情况下,可以将推荐备份设备和/或介质用来将备份的数据恢复到源设备。
[0037] 图3示出了示例系统300的框图,其可以代表图1的计算设备。系统300包括资源选择机器可读指令302,该资源选择机器可读指令302可以包括图1中描绘的计算设备的各种模块中的某些。装载资源选择机器可读指令302用于在一个或多个处理器304上执行。处理器可以包括微处理器微控制器、处理器模块或子系统、可编程集成电路、可编程门阵列或另一控制或计算设备。可以将(多个)处理器304耦合到网络接口306(以允许系统300通过数据网络施行通信)和存储介质(或多个存储介质)308。
[0038] 可以将存储介质308实施为一个或多个计算机可读或机器可读存储介质。存储介质包括不同形式的存储器,所述存储器包括:半导体存储器设备,诸如动态或静态随机存取存储器(DRAM或SRAM)、可擦除和可编程只读存储器(EPROM)、电可擦除和可编程只读存储器(EEPROM)以及闪速存储器;磁盘,诸如固定盘、软盘和可移动盘;包括磁带的其他磁介质;光学介质,诸如紧凑盘(CD)或数字视频盘(DVD);或者其他适当类型的存储设备。注意,可以将上文讨论的指令提供在一个计算机可读或机器可读的存储介质上,或替换地,可以将其提供在分布于可能具有多个节点的系统中的多个计算机可读或机器可读存储介质上。将这样的计算机可读或机器可读存储介质或多个介质认为是 物品(或制品)的一部分。物品或制品可以是指任何适当的所制造的组件或多个组件。可以将存储介质或多个存储介质或者置于运行机器可读指令的机器中,或者置于例如可以通过网络从其下载机器可读指令以供执行的远程站点处。
[0039] 尽管上文已经详细描述了几个实施方式,但是其他修改是可能的。例如,图中所描绘的逻辑流可以不要求所示出的特定顺序或依次顺序来达到合期望的结果。此外,可以向所描述的流提供其他步骤,或者可以从所描述的流中消除步骤。类似地,可以向所描述的系统添加其他组件,或者从所描述的系统移除其他组件。相应地,其他实施方式在所附权利要求的范围之内。
QQ群二维码
意见反馈