首页 / 专利库 / 专利权 / 发明 / 用于管理存储系统的方法、设备和计算机程序产品

用于管理存储系统的方法、设备和计算机程序产品

阅读:24发布:2021-04-11

专利汇可以提供用于管理存储系统的方法、设备和计算机程序产品专利检索,专利查询,专利分析的服务。并且本公开涉及一种用于管理存储系统的方法、设备和 计算机程序 产品。根据本公开的示例性实现,提供了一种用于管理存储系统的方法。在该方法中,响应于与存储系统相关联的多个存储设备的相应磨损程度高于第一预定 阈值 ,从多个存储设备中选择目标存储设备。针对多个存储设备中的多个区 块 ,确定多个区块的相应 访问 负载。基于多个区块的相应访问负载,从位于目标存储设备以外的存储设备上的多个区块中选择源区块。将源区块中的数据移动至目标存储设备。利用上述方法,可以避免资源池中的各个存储设备在相近的时间到达寿命终止,进而避免出现数据丢失。进一步,提供了一种用于管理存储系统的设备和计算机程序产品。,下面是用于管理存储系统的方法、设备和计算机程序产品专利的具体信息内容。

1.一种用于管理存储系统的方法,所述方法包括:
响应于与所述存储系统相关联的多个存储设备的相应磨损程度高于第一预定阈值,从所述多个存储设备中选择目标存储设备;
针对所述多个存储设备中的多个区,确定所述多个区块的相应访问负载;
基于所述多个区块的所述相应访问负载,从位于所述目标存储设备以外的存储设备上的多个区块中选择源区块;以及
将所述源区块中的数据移动至所述目标存储设备。
2.根据权利要求1所述的方法,进一步包括:获取所述多个存储设备的相应磨损程度包括:针对所述多个存储设备中的给定存储设备,
确定所述给定存储设备已经被执行的擦除操作的擦除次数;以及
基于所述擦除次数以及所述给定存储设备允许的最大擦除次数,确定针对所述给定存储设备的磨损程度。
3.根据权利要求1所述的方法,其中从所述多个存储设备中选择目标存储设备包括:
从所述多个存储设备中选择具有较高磨损程度的存储设备来作为所述目标存储设备。
4.根据权利要求1所述的方法,其中确定所述多个区块的相应访问负载包括:
针对所述多个区块中的给定区块,基于以下中的至少任一项来确定所述给定区块的访问负载:所述给定区块被写入的频率以及被写入至所述给定区块的数据量。
5.根据权利要求4所述的方法,其中从所述多个区块中选择源区块包括:从所述多个区块中选择具有较高访问负载的区块来作为所述源区块。
6.根据权利要求1所述的方法,其中将所述目标区块中的数据移动至所述目标存储设备包括:响应于所述目标存储设备中存在空闲区块,
将所述目标区块中的数据移动至所述空闲区块。
7.根据权利要求1所述的方法,其中将所述目标区块中的数据移动至所述目标存储设备包括:响应于所述目标存储设备中不存在空闲区块,
确定所述目标存储设备中的多个区块的访问负载;
从所述多个区块中选择访问负载较低的区块以作为目的地区块;以及
交换所述目标区块和所述目的地区块中的数据。
8.根据权利要求1所述的方法,进一步包括:
获取所述目标存储设备的磨损程度;
响应于所述磨损程度高于第二阈值,将所述目标存储设备中的各个区块中的数据迁移至后备存储设备。
9.根据权利要求1所述的方法,进一步包括:
基于所述源区块的地址以及移动的所述源区块中的数据在所述目标存储设备中的地址,更新所述存储系统与所述多个存储设备之间的地址映射;以及
基于更新的所述地址映射,处理针对所述存储系统中的数据的访问请求
10.根据权利要求9所述的方法,进一步包括:
从所述至少一个存储设备中选择另一存储设备以作为所述目标存储设备。
11.一种用于管理存储系统的设备,包括:
至少一个处理器;
易失性存储器;以及
与所述至少一个处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被所述至少一个处理器执行时使得所述设备执行动作,所述动作包括:
响应于与所述存储系统相关联的多个存储设备的相应磨损程度高于第一预定阈值,从所述多个存储设备中选择目标存储设备;
针对所述多个存储设备中的多个区块,确定所述多个区块的相应访问负载;
基于所述多个区块的所述相应访问负载,从位于所述目标存储设备以外的存储设备上的多个区块中选择源区块;以及
将所述源区块中的数据移动至所述目标存储设备。
12.根据权利要求11所述的设备,所述动作进一步包括:获取所述多个存储设备的相应磨损程度包括:针对所述多个存储设备中的给定存储设备,
确定所述给定存储设备已经被执行的擦除操作的擦除次数;以及
基于所述擦除次数以及所述给定存储设备允许的最大擦除次数,确定针对所述给定存储设备的磨损程度。
13.根据权利要求11所述的设备,其中从所述多个存储设备中选择目标存储设备包括:
从所述多个存储设备中选择具有较高磨损程度的存储设备来作为所述目标存储设备。
14.根据权利要求11所述的设备,其中确定所述多个区块的相应访问负载包括:
针对所述多个区块中的给定区块,基于以下中的至少任一项来确定所述给定区块的访问负载:所述给定区块被写入的频率以及被写入至所述给定区块的数据量。
15.根据权利要求14所述的设备,其中从所述多个区块中选择源区块包括:从所述多个区块中选择具有较高访问负载的区块来作为所述源区块。
16.根据权利要求11所述的设备,其中将所述目标区块中的数据移动至所述目标存储设备包括:响应于所述目标存储设备中存在空闲区块,
将所述目标区块中的数据移动至所述空闲区块。
17.根据权利要求11所述的设备,其中将所述目标区块中的数据移动至所述目标存储设备包括:响应于所述目标存储设备中不存在空闲区块,
确定所述目标存储设备中的多个区块的访问负载;
从所述多个区块中选择访问负载较低的区块以作为目的地区块;以及
交换所述目标区块和所述目的地区块中的数据。
18.根据权利要求11所述的设备,其中所述动作进一步包括:
获取所述目标存储设备的磨损程度;
响应于所述磨损程度高于第二阈值,将所述目标存储设备中的各个区块中的数据迁移至后备存储设备。
19.根据权利要求11所述的设备,其中所述动作进一步包括:
基于所述源区块的地址以及移动的所述源区块中的数据在所述目标存储设备中的地址,更新所述存储系统与所述多个存储设备之间的地址映射;以及
基于更新的所述地址映射,处理针对所述存储系统中的数据的访问请求。
20.根据权利要求19所述的设备,其中所述动作进一步包括:
从所述至少一个存储设备中选择另一存储设备以作为所述目标存储设备。
21.一种计算机程序产品,所述计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,所述机器可执行指令用于执行根据权利要求1-10中的任一项所述的方法。

说明书全文

用于管理存储系统的方法、设备和计算机程序产品

技术领域

[0001] 本公开的各实现方式涉及存储管理,更具体地,涉及用于管理存储系统的资源池中的各个存储设备的方法、设备和计算机程序产品。

背景技术

[0002] 随着数据存储技术的发展,各种数据存储设备已经能够向用户提供越来越高的数据存储能,并且数据访问速度也有了很大程度的提高。在提高数据存储能力的同时,用户对于数据可靠性和存储系统的响应时间也提供了越来越高的需求。目前,已经开发出了基于冗余磁盘阵列(Redundant Array of Independent Disks,RAID)的多种数据存储系统来提高数据的可靠性。当存储系统中的一个或者多个磁盘出现故障时,可以从其他正常操作的磁盘上的数据来恢复出故障磁盘中的数据。
[0003] 目前已经开发出了映射独立磁盘冗余阵列(Mapped RAID)。在该映射RAID中,磁盘是一个逻辑概念并且可以包括多个区(extent)。一个逻辑磁盘中包括的多个区块可以分布在资源池中的不同物理存储设备上。对于映射RAID的一个条带中的多个区块而言,该多个区块应当分布在不同的物理存储设备上,以便当该多个区块中的一个区块所在的物理存储设备出现故障时,可以执行重建操作以便从其他区块所在的物理存储设备中恢复数据。
[0004] 将会理解,由于资源池中的各个存储设备投入使用的时间以及使用状态等存在差异,各个存储设备的磨损程度(wear degree)可能是不同的。此时,如何控制资源池中的各个存储设备的磨损程度,进而避免存储系统中的数据丢失,成为一个技术难题。发明内容
[0005] 因而,期望能够开发并实现一种以更为有效的方式来管理存储系统的技术方案。期望该技术方案能够与现有的存储系统相兼容,并且通过改造现有存储系统的各种配置,来以更为有效的方式管理存储系统。
[0006] 根据本公开的第一方面,提供了一种用于管理存储系统的方法。在该方法中,响应于与存储系统相关联的多个存储设备的相应磨损程度高于第一预定阈值,从多个存储设备中选择目标存储设备。针对多个存储设备中的多个区块,确定多个区块的相应访问负载。基于多个区块的相应访问负载,从位于目标存储设备以外的存储设备上的多个区块中选择源区块。将源区块中的数据移动至目标存储设备。
[0007] 根据本公开的第二方面,提供了一种用于管理存储系统的设备。该设备包括:至少一个处理器;易失性存储器;以及与至少一个处理器耦合的存储器,存储器具有存储于其中的指令,指令在被至少一个处理器执行时使得设备执行动作。该动作包括:响应于与存储系统相关联的多个存储设备的相应磨损程度高于第一预定阈值,从多个存储设备中选择目标存储设备;针对多个存储设备中的多个区块,确定多个区块的相应访问负载;基于多个区块的相应访问负载,从位于目标存储设备以外的存储设备上的多个区块中选择源区块;以及将源区块中的数据移动至目标存储设备。
[0008] 根据本公开的第三方面,提供了一种计算机程序产品,计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,机器可执行指令用于执行根据本公开的第一方面的方法。附图说明
[0009] 结合附图并参考以下详细说明,本公开各实现方式的特征、优点及其他方面将变得更加明显,在此以示例性而非限制性的方式示出了本公开的若干实现方式。在附图中:
[0010] 图1A和1B分别示意性示出了其中可以实现本公开的方法的存储系统的示意图;
[0011] 图2示意性示出了其中可以实现本公开的方法的示例性环境的框图
[0012] 图3示意性示出了图2中的存储资源池的图示;
[0013] 图4A示意性示出了根据一个技术方案的用于管理存储系统的框图;
[0014] 图4B示意性示出了根据本公开的一个实现方式的用于管理存储系统的框图;
[0015] 图5示意性示出了根据本公开的一个实现方式的用于管理存储系统的方法的流程图
[0016] 图6A示意性示出了根据本公开的一个实现方式数据移动之前的各个存储设备中的区块的框图;
[0017] 图6B示意性示出了根据本公开的一个实现方式数据移动之后的各个存储设备中的区块的框图;
[0018] 图7示意性示出了根据本公开的一个实现方式的用于管理存储系统的方法的流程图;
[0019] 图8示意性示出了根据本公开一个实现方式的用于在两个存储设备之间移动数据的方法的流程图;以及
[0020] 图9示意性示出了根据本公开的示例性实现的用于管理存储系统的设备的框图。

具体实施方式

[0021] 下面将参照附图更详细地描述本公开的优选实现。虽然附图中显示了本公开的优选实现,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实现所限制。相反,提供这些实现是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0022] 在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实现”和“一个实现”表示“至少一个示例实现”。术语“另一实现”表示“至少一个另外的实现”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0023] 在本公开的上下文中,存储系统可以是基于RAID的存储系统。基于RAID的存储系统可以将多个存储设备组合起来,成为一个磁盘阵列。通过提供冗余的存储设备,可以使得整个磁盘组的可靠性大大超过单一的存储设备。RAID可以提供优于单一的存储设备的各种优势,例如,增强数据整合度,增强容错功能,增加吞吐量或容量,等等。RAID存在多个标准,例如RAID-1,RAID-2,RAID-3,RAID-4,RAID-5,RAID-6,RAID-10,RAID-50等等。关于RAID级别的更多细节,本领域技术人员例如可以参见https://en.wikipedia.org/wiki/Standard_RAID_levels、以及https://en.wikipedia.org/wiki/Nested_RAID_levels等。
[0024] 图1A示意性示出了其中可以实现本公开的方法的存储系统100A的示意图。在图1A所示的存储系统中,以包括五个独立存储设备(110、112、114、116以及118)的RAID-5(4D+1P,其中4D表示存储系统中包括四个存储设备来用于存储数据,1P表示存储系统中包括一个存储设备来用于存储P校验)阵列为示例,来说明RAID的工作原理。应当注意,尽管图1A中示意性示出了五个存储设备,在其他的实现方式中,根据RAID的等级不同,还可以包括更多或者更少的存储设备。尽管图1A中示出了条带120、122、124、…、126,在其他的示例中,RAID系统还可以包括不同数量的条带。
[0025] 在RAID中,条带跨越多个物理存储设备(例如,条带120跨越存储设备110、112、114、116以及118)。可以简单地将条带理解为多个存储设备中的满足一定地址范围的存储区域。在条带120中存储的数据包括多个部分:存储在存储设备110上的数据块D00、存储在存储设备112上的数据块D01、存储在存储设备114上的数据块D02、存储在存储设备116上的数据块D03、以及存储在存储设备118上的数据块P0。在此示例中,数据块D00、D01、D02、以及D03是被存储的数据,而数据块P0是被存储数据的P校验。
[0026] 在其他条带122和124中存储数据的方式也类似于条带120,不同之处在于,有关其他数据块的校验可以存储在不同于存储设备118的存储设备上。以此方式,当多个存储设备110、112、114、116以及118中的一个存储设备出现故障时,可以从其他的正常的存储设备中恢复出故障设备中的数据。
[0027] 图1B示意性示出了存储系统110A的重建过程的示意图100B。如图1B所示,当一个存储设备(例如,以阴影示出的存储设备116)出现故障时,可以从其余的正常操作的多个存储设备110、112、114、118中恢复数据。此时,可以向RAID中加入新的后备存储设备118B来替代存储设备118,以此方式,可以将恢复的数据写入118B并实现系统的重建。
[0028] 应当注意,尽管在上文中参见图1A和图1B描述了包括5个存储设备(其中4个存储设备用于存储数据,1个存储设备用于存储校验)的RAID-5的存储系统,根据其他RAID等级的定义,还可以存在包括其他数量的存储设备的存储系统。例如,基于RAID-6的定义,可以利用两个存储设备来分别存储校验P和Q。又例如,基于三重校验RAID的定义,可以利用三个存储设备来分别存储校验P、Q和R。
[0029] 随着分布式存储技术的发展,图1A和1B所示的存储系统中的各个存储设备110、112、114、116以及118可以不再局限于物理存储设备,而是可以是虚拟存储设备。例如,存储设备110上的各个区块可以分别来自于资源池中的不同的物理存储设备(在下文中将简称为存储设备)。图2示意性示出了其中可以实现本公开的方法的示例性环境的框图。如图2所示,存储资源池270可以包括多个物理存储设备210、220、230、240、250、…、260。此时,该多个存储设备中的存储空间可以被分配给多个存储系统290、…、292。此时,存储系统290、…、
292可以经由网络280来访问存储资源池270中的各个存储设备中的存储空间。
[0030] 图3示意性示出了如图2所示的存储资源池270的更多信息的图示。资源池270可以包括多个存储设备210、220、230、240、250、…、260。每个存储设备可以包括多个区块,其中空白区块(如图例360所示)表示空闲的区块,以条纹示出的区块(如图例362所示)表示用于图1中的存储系统110A的第一条带的区块,而以阴影示出的区块(如图例364所示)表示用于图1中的存储系统110A的第二条带的区块。此时,用于第一条带的区块312、322、332、342、352分别用于存储第一条带的数据块D00、D01、D02、D03和校验P0。用于第二条带的区块324、
334、344、366和314分别用于存储第二条带的数据块D10、D11、D12、D13和校验P1。
[0031] 如图3所示,在各个存储设备中还可以存在预留的空闲部分370,以便用于在资源池中的一个存储设备出现故障时,可以选择各个存储设备中的空闲部分370中的区块,来重建故障存储设备中的各个区块。
[0032] 应当注意,图3仅以4D+1P的RAID-5存储系统为示例示出了各个条带中的区块如何分布在资源池的多个存储系统中。当采用基于其他RAID等级时,本领域技术人员可以基于上文的原理来实现具体细节。例如,在6D+1P+1Q的RAID-6存储系统中,每个条带中的8个区块可以分布在多个存储设备上,进而保证多个存储设备的负载均衡。
[0033] 将会理解,目前已经提出了用于控制存储资源池270中各个存储设备的磨损平,进而管理存储资源池270并且进行设备更新的技术方案。存储设备210至260并不是可以无限期地使用,而是存在一定的使用寿命。图4A示意性示出了根据一个技术方案的用于管理存储系统的框图400A。如图4A所示,采用传统技术方案,可以将与存储系统相关联的多个存储设备210至260的磨损程度维持在类似的水平。在图4A的示例中,存储设备210、220、230、250和260的磨损程度为85%,而存储设备240的磨损程度为86%。
[0034] 将会理解,如果一直采用如图4A所示的技术方案,则多个存储设备210至260将几乎同时达到寿命终止。这将造成管理员的工作负载骤增,并且还可能会导致由于多个存储设备同时故障的数据丢失。当存储设备的磨损水平达到一定程度(例如高于96%)时,可能会面临寿命终止(End of Life)。
[0035] 尽管图4A的技术方案可以确保存储资源池270中的各个存储设备的磨损水平在使用期间保持类似,然而,类似的磨损水平将导致存储资源池270中的各个存储设备几乎在相同的时间达到寿命终止。此时,将会出现几乎同时需要更新多个存储设备的情况。一方面,这将造成存储系统的管理员面临极大的工作负荷;另一方面,多个存储设备面临寿命终止因而随时有可能出现故障,进而造成存储系统中的数据丢失。
[0036] 为了解决上述缺陷,本公开的实现方式提供了一种用于管理存储系统的方法、设备和计算机程序产品。在下文中,将详细描述本公开的具体实现方式。根据本公开内容的一个实现方式,提供了一种用于管理存储系统的方法。在该方法中,响应于与存储系统相关联的多个存储设备的相应磨损程度高于第一预定阈值,从多个存储设备中选择目标存储设备。针对多个存储设备中的目标存储设备以外的至少一个存储设备中的多个区块,确定多个区块的相应访问负载。基于多个区块的相应访问负载,从多个区块中选择源区块。将源区块中的数据移动至目标存储设备。
[0037] 利用上述示例性实现,当资源池270中的各个存储设备的磨损程度高于第一预定阈值时启动根据本公开的各个实现方式的方法。通过从多个存储设备中选择目标存储设备(例如,可以选择磨损程度最高的存储设备作为目标存储设备),并且将各个存储设备中的访问负载较重的区块移动至该目标存储设备,可以首先使得目标存储设备的磨损程度达到更新设备的要求,并替换目标存储设备。以此方式,可以使得多个存储设备在不同的时间点达到寿命终止,进而可以避免资源池270中的多个存储设备同时需要被更换的情况。以此方式,一方面可以在不同的时间点更新资源池270中的达到寿命终止的存储设备;另一方面,还可以避免在多个存储设备同时面临寿命终止时可能出现的存储系统中的数据丢失的情况。在下文中,将参见图4B描述用于管理存储设备的方法的更多细节。
[0038] 将会理解,尽管在本公开的上下文中以基于RAID的存储系统的资源池270为示例来描述了用于管理存储系统的实现方式。根据本公开的示例性实现还可以被实现在其他的包括多个存储设备的资源池中。
[0039] 图4B示意性示出了根据本公开的一个实现方式的用于管理存储系统的框图400B。在此实现方式中,可以监视各个存储设备210至260的磨损程度,当磨损程度满足预定条件(例如,各个存储设备的磨损程度均高于85%或者其他数值时)时,可以从多个存储设备210至260中选择一个存储设备240(例如,选择磨损程度最高的)作为目标存储设备。接着通过将目标存储设备240以外的其他存储设备上的访问负载较高的区块移动至目标存储设备
240,可以使得目标存储设备240被更为频繁地访问。以此方式,可以加快目标存储设备240到达寿命终止的速度,进而可以避免多个存储设备210至260在相似的时间点到达寿命终止的情况。
[0040] 在下文中,将参见图5详细描述如何管理存储系统的更多细节。图5示意性示出了根据本公开的一个实现方式的用于管理存储系统的方法的流程图500。在框510处,首先判断与存储系统相关联的多个存储设备的相应磨损程度是否高于第一预定阈值。第一预定阈值可以被定义为存储设备即将面临寿命终止的磨损程度。例如,当以百分比来表示磨损程度时,可以将第一预定阈值设置为例如85%附近范围内的数值。
[0041] 根据本公开的示例性实现,可以将不同存储设备的磨损程度与第一预定阈值进行比较。例如,可以将多个存储设备中的每个存储设备的磨损程度来与第一预定阈值进行比较,以确定框510处的判断结果。又例如,可以选择最高或者最低的磨损程度来与第一预定阈值进行比较。又例如,由于多个存储设备的磨损程度是类似的,可以从多个存储设备中选择任一存储设备并且将所选择的存储设备的磨损程度与第一预定阈值进行比较。
[0042] 在下文中,将详细描述如何确定存储设备的磨损程度。针对多个存储设备中的给定存储设备而言,可以基于与该给定存储设备相关联的擦除次数来确定磨损程度。将会理解,基于给定存储设备的型号,可以确定给定存储设备允许的最大擦除次数MAX。在此的最大擦除次数是存储设备的制造者给出的确保存储设备可以正常操作的擦除次数。当存储设备的擦除次数低于该最大值时,存储设备可以正常操作,而当存储设备的擦除次数高于该最大值时,则存储设备将会面临寿命终止并且可能出现故障。
[0043] 因而,可以基于给定存储设备已经被执行的擦除操作的擦除次数N以及最大擦除次数MAX的比值,来确定针对给定存储设备的磨损程度。根据本公开的示例性实现,假设最大擦除次数MAX=1000,而目前给定存储设备已经被执行了700次擦除操作,则此时该给定存储设备的磨损程度为700/1000*100%=70%。
[0044] 继续参见图5,在框520处,可以从多个存储设备中选择目标存储设备。根据本公开的示例性实现,由于多个存储设备210至260的磨损程度类似,可以从多个存储设备210至260中选择任意的存储设备来作为目标存储设备。根据本公开的示例性实现,可以从多个存储设备中选择磨损程度较高(例如,最高)的存储设备来作为目标存储设备。以此方式,可以使得目标存储设备的磨损程度尽快达到利用后备存储设备替换目标存储设备的条件。
[0045] 在框530处,针对多个存储设备中的多个区块,确定多个区块的相应访问负载。继续图4B的示例,多个存储设备210至260中的每个存储设备可以包括多个区块,在此可以确定每个区块的访问负载。在此的访问负载是导致该区块所在的存储设备的磨损程度增加的访问造成的负载。将会理解,对于固态盘(Solid State Disk,SSD)类型的存储设备而言,存储设备的寿命取决于该存储设备已经被执行擦除的次数和最大擦除次数的比例。由于写操作将会导致擦除操作而读操作并不会导致擦除操作,因而在此可以基于对每个区块的写操作来确定每个区块的访问负载。
[0046] 根据本公开的示例性实现,针对多个区块中的给定区块,可以基于给定区块被写入的频率来确定访问负载。例如,可以以在过去预定时间段内该给定区块被写入的频率来确定访问负载。以此方式,可以以量化的方式衡量各个区块的访问负载。将会理解,由于写入操作对于存储设备的磨损程度的影响还取决于被写入的数据量,因而还可以基于被写入至给定区块的数据量来确定访问负载。以此方式,可以以更为精细的粒度来准确地确定各个区块的访问负载。根据本公开的示例性实现,还可以基于写入频率和写入的数据量两者来确定访问负载。
[0047] 在框540处,基于多个区块的相应访问负载,从位于目标存储设备以外的存储设备上的多个区块中选择源区块。将会理解,在此的源区块是指将被移动至目标存储设备的区块。根据本公开的示例性实现,可以从多个区块中选择具有较高访问负载的区块来作为源区块。由于源区块具有较高的访问负载,通常而言,在源区块中的数据被移动至目标存储设备中的目的地区块之后,该目的地区块的访问负载也将保持在较高水平。利用上述示例性实现,可以尽快使得目标存储设备的磨损程度达到需要利用后备存储设备来替换该目标存储设备的条件。
[0048] 在框550处,将源区块中的数据移动至目标存储设备。基于目标存储设备中的各个区块的状态,可以采用不同的方法来移动源区块中的数据。根据本公开的示例性实现,如果目标存储设备中存在空闲区块,则可以直接将目标区块中的数据移动至空闲区块。在下文中,将分别参见图6A和图6B来详细描述如何移动源区块中的数据。
[0049] 图6A示意性示出了根据本公开的一个实现方式数据移动之前的各个存储设备中的区块的框图600A。参见图6A,存储设备240被选择作为目标存储设备,此时将要从存储设备210向目标存储设备240移动数据。参见图例630,不同的图案表示不同的访问负载:网格图案表示访问负载较重的区块(即,“热”区块);条文图案表示访问负载中等的区块(即,中等区块);阴影图案表示访问负载较轻的区块(即,“冷”区块);而空白图案表示尚未被使用的空闲区块。
[0050] 在图6A中,目标存储设备240下方的多个区块表示该目标存储设备240中的区块,其中区块620表示空闲区块,而区块622表示冷区块。存储设备210下方的多个区块表示该存储设备210中的区块,其中区块610和612表示热区块。基于上文描述的原理,可以将热区块610和612移动至目标存储设备240。由于在目标存储设备240中存在空闲区块620,可以直接将区块610中的数据移动至空闲区块620A。
[0051] 图6B示意性示出了根据本公开的一个实现方式数据移动之后的各个存储设备中的区块的框图600B。如图6B所示,在数据移动操作之后,原本位于存储设备210中的区块610中的热数据被移动至目标存储设备240中的区块620处。此时,存储设备210中的区块610变为空闲区块。利用上述示例性实现,可以降低存储设备210的磨损程度的增长速度。随着目标存储设备240中的各个区块被访问,目标存储设备240的磨损程度的增长速度将会提高。例如,在经过一段时间之后,磨损程度可能会达到触发利用后备存储设备来替换目标存储设备240的第二预定阈值(例如,96%或者其他数值)。
[0052] 根据本公开的示例性实现,如果目标存储设备中不存在空闲区块,则可以从目标存储设备中选择目的地区块,并且交换目标区块和目的地区块中的数据。具体地,可以首先确定目标存储设备中的多个区块的访问负载。继续参见图6A,当区块610中的数据移动被移动至区块620后,则在目标存储设备240中不存在空闲区块。此时,从多个区块中选择访问负载较低的区块622以作为目的地区块。继而,可以将存储设备210中的区块612中的热数据与目标存储设备240中的区块622中的冷数据进行交换。
[0053] 如图6B所示,在数据交换操作之后,原本位于存储设备210中的区块612中的热数据被交换至目标存储设备240中的区块622处,而原本位于目标存储设备240中的区块622中的冷数据被交换至存储设备210中的区块612处。此时,存储设备210的磨损程度的增长速度将会变慢,而目标存储设备240的磨损程度的增长速度将会加快。利用上述示例性实现,目标存储设备240将先于其他存储设备210至230以及250和260最先达到第二预定阈值。
[0054] 根据本公开的示例性实现,可以周期性地获取目标存储设备240的磨损程度。如果磨损程度高于第二阈值,将目标存储设备中的各个区块中的数据迁移至后备存储设备。在此的数据迁移是指利用后备存储设备来替换已经面临寿命终止的目标存储设备240。可以基于已有的方案来执行数据迁移。具体地,可以以并行或者串行的方式来将目标存储设备中的各个区块中的数据拷贝至后备存储设备中的相应区块。进一步,还可以基于相应区块的地址来更新存储系统的地址映射。
[0055] 根据本公开的示例性实现,可以逐一针对多个存储设备中的每个存储设备执行上文描述的方法500。具体地,在已经完成利用后备存储设备来替换目标存储设备240之后,还可以从至少一个存储设备中选择另一存储设备以作为目标存储设备。返回图4,由于此时存储设备240以外的其他存储设备210至230、250和260的磨损程度均为85%,此时可以从上述存储设备中选择任意的存储设备来作为目标存储设备,并且重复执行上文参见图5描述的方法500。
[0056] 图7示意性示出了根据本公开的一个实现方式的用于管理存储系统的方法700的流程图。方法700开始于框710,可以将多个存储设备210至260中的磨损程度最高的存储设备选择作为目标存储设备。由于存储设备240的磨损程度(86%)高于其他存储设备的磨损程度(85%),此时可以将存储设备240作为目标存储设备。在框720处,可以将多个存储设备中的目标存储设备以外的至少一个存储设备210至230、250和260中的访问负载较高的区块移动至目标存储设备240。
[0057] 将会理解,在本公开中描述的方法500和700并不影响存储系统的常规操作,而是存储系统可以正常运行并且可以继续服务于来自各个用户的访问请求。随着存储系统的运行,目标存储设备240的磨损程度可以不断提高。如框730所示,可以不断监视目标存储设备240的磨损程度,并且判断监视的磨损程度是否达到第二预定阈值。如果判断结果为“是”,则方法700前进至框740。此时,可以采用上文描述的方法将目标存储设备中的各个区块中的数据迁移至后备存储设备中。在框750处,可以判断是否已经处理了全部多个存储设备
210至260。如果判断结果为“否”,则方法700返回框“710”以便处理下一存储设备;如果判断结果为“是”,则方法700结束。
[0058] 在下文中,将参见图8描述有关图7中的框720处所示的移动数据的操作的更多细节。图8示意性示出了根据本公开一个实现方式的用于在两个存储设备之间移动数据的方法800的流程图。在框810处,可以确定多个存储设备210至260中的各个区块的访问负载。继而,在框820处,将位于多个存储设备中的目标存储设备240以外的存储设备210至230、250和260处的、访问负载最高的区块选择为源区块。在此的源区块是指将被移动至目标存储设备240中的区块。
[0059] 在后续操作中,将分别针对在目标存储设备240中是否存在空闲区块,来进行相应的处理。如框830所示,首先判断在目标存储设备240中是否存在空闲区块。如果框830的判断结果为“是”,则方法800前进至框840。此时,可以将源区块中的数据直接移动至空闲区块。如果框830的判断结果为“否”,则方法800前进至框850。在此,可以判断在目标存储设备240中是否存在目的地区块,并且该目的地区块的访问负载低于源区块的访问负载。如果框
850的判断结果为“是”,则方法800前进至框860。在框860处,可以交换源区块和目的地区块中的数据。如果框850的判断结果为“否”,则表示此时目标存储设备中各个区块的访问负载已经达到最高。此时,方法800前进至框870并结束。
[0060] 根据本公开的示例性实现,在此描述的存储系统可以是如上文参见图3描述的映射RAID的存储系统。因而,在已经在两个存储设备之间执行了数据移动之后,还需要基于源区块的原始地址以及移动的源区块中的数据在目标存储设备中的新地址,来更新存储系统与多个存储设备之间的地址映射。具体地,可以利用新地址来替换地址映射中的原始地址。继而,可以基于更新的地址映射,处理针对存储系统中的数据的访问请求。利用上述示例性实现,可以确保来自用户的请求可以准确地访问期望的数据。
[0061] 在上文中已经参见图2至图8详细描述了根据本公开的方法的示例,在下文中将描述相应的设备的实现。根据本公开的示例性实现,提供了用于管理存储系统的设备。该设备包括:选择模块,配置用于响应于与存储系统相关联的多个存储设备的相应磨损程度高于第一预定阈值,从多个存储设备中选择目标存储设备;确定模块,配置用于针对多个存储设备中的多个区块,确定多个区块的相应访问负载;源选择模块,配置用于基于多个区块的相应访问负载,从位于目标存储设备以外的存储设备上的多个区块中选择源区块;以及移动模块,配置用于将源区块中的数据移动至目标存储设备。
[0062] 根据本公开的示例性实现,所述选择模块进一步配置用于获取多个存储设备的相应磨损程度包括:针对多个存储设备中的给定存储设备,确定给定存储设备已经被执行的擦除操作的擦除次数;以及基于擦除次数以及给定存储设备允许的最大擦除次数,确定针对给定存储设备的磨损程度。
[0063] 根据本公开的示例性实现,所述选择模块进一步配置用于从多个存储设备中选择具有较高磨损程度的存储设备来作为目标存储设备。
[0064] 根据本公开的示例性实现,所述确定模块进一步配置用于针对多个区块中的给定区块,基于以下中的至少任一项来确定给定区块的访问负载:给定区块被写入的频率以及被写入至给定区块的数据量。
[0065] 根据本公开的示例性实现,所述源选择模块进一步配置用于从多个区块中选择具有较高访问负载的区块来作为源区块。
[0066] 根据本公开的示例性实现,所述移动模块进一步配置用于响应于目标存储设备中存在空闲区块,将目标区块中的数据移动至空闲区块。
[0067] 根据本公开的示例性实现,所述移动模块进一步配置用于响应于目标存储设备中不存在空闲区块,确定目标存储设备中的多个区块的访问负载;从多个区块中选择访问负载较低的区块以作为目的地区块;以及交换目标区块和目的地区块中的数据。
[0068] 根据本公开的示例性实现,该设备进一步包括更新模块,配置用于获取目标存储设备的磨损程度;响应于磨损程度高于第二阈值,将目标存储设备中的各个区块中的数据迁移至后备存储设备。
[0069] 根据本公开的示例性实现,更新模块进一步配置用于基于源区块的地址以及移动的源区块中的数据在目标存储设备中的地址,更新存储系统与多个存储设备之间的地址映射;以及基于更新的地址映射,处理针对存储系统中的数据的访问请求。
[0070] 根据本公开的示例性实现,所述选择模块进一步配置用于从至少一个存储设备中选择另一存储设备以作为目标存储设备。
[0071] 图9示意性示出了根据本公开的示例性实现的用于管理存储系统的设备900的框图。如图所示,设备900包括中央处理单元(CPU)901,其可以根据存储在只读存储器(ROM)902中的计算机程序指令或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序指令,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口
905也连接至总线904。
[0072] 设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0073] 上文所描述的各个过程和处理,例如方法500、700和800,可由处理单元901执行。例如,在一些实现中,方法500、700和800可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实现中,计算机程序的部分或者全部可以经由ROM 
902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序被加载到RAM 903并由CPU 901执行时,可以执行上文描述的方法500、700和800的一个或多个步骤。备选地,在其他实现中,CPU 901也可以以其他任何适当的方式被配置以实现上述过程/方法。
[0074] 根据本公开的示例性实现,提供了一种用于管理存储系统的设备,包括:至少一个处理器;易失性存储器;以及与至少一个处理器耦合的存储器,存储器具有存储于其中的指令,指令在被至少一个处理器执行时使得设备执行动作。动作包括:响应于与存储系统相关联的多个存储设备的相应磨损程度高于第一预定阈值,从多个存储设备中选择目标存储设备;针对多个存储设备中的多个区块,确定多个区块的相应访问负载;基于多个区块的相应访问负载,从位于目标存储设备以外的存储设备上的多个区块中选择源区块;以及将源区块中的数据移动至目标存储设备。
[0075] 根据本公开的示例性实现,获取多个存储设备的相应磨损程度包括:针对多个存储设备中的给定存储设备,确定给定存储设备已经被执行的擦除操作的擦除次数;以及基于擦除次数以及给定存储设备允许的最大擦除次数,确定针对给定存储设备的磨损程度。
[0076] 根据本公开的示例性实现,从多个存储设备中选择目标存储设备包括:从多个存储设备中选择具有较高磨损程度的存储设备来作为目标存储设备。
[0077] 根据本公开的示例性实现,确定多个区块的相应访问负载包括:针对多个区块中的给定区块,基于以下中的至少任一项来确定给定区块的访问负载:给定区块被写入的频率以及被写入至给定区块的数据量。
[0078] 根据本公开的示例性实现,从多个区块中选择源区块包括:从多个区块中选择具有较高访问负载的区块来作为源区块。
[0079] 根据本公开的示例性实现,将目标区块中的数据移动至目标存储设备包括:响应于目标存储设备中存在空闲区块,将目标区块中的数据移动至空闲区块。
[0080] 根据本公开的示例性实现,将目标区块中的数据移动至目标存储设备包括:响应于目标存储设备中不存在空闲区块,确定目标存储设备中的多个区块的访问负载;从多个区块中选择访问负载较低的区块以作为目的地区块;以及交换目标区块和目的地区块中的数据。
[0081] 根据本公开的示例性实现,动作进一步包括:获取目标存储设备的磨损程度;响应于磨损程度高于第二阈值,将目标存储设备中的各个区块中的数据迁移至后备存储设备。
[0082] 根据本公开的示例性实现,动作进一步包括:基于源区块的地址以及移动的源区块中的数据在目标存储设备中的地址,更新存储系统与多个存储设备之间的地址映射;以及基于更新的地址映射,处理针对存储系统中的数据的访问请求。
[0083] 根据本公开的示例性实现,动作进一步包括:从至少一个存储设备中选择另一存储设备以作为目标存储设备。
[0084] 根据本公开的示例性实现,提供了一种计算机程序产品,计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,机器可执行指令用于执行根据本公开的方法。
[0085] 根据本公开的示例性实现,提供了一种计算机可读介质。计算机可读介质上存储有机器可执行指令,当机器可执行指令在被至少一个处理器执行时,使得至少一个处理器实现根据本公开方法。
[0086] 本公开可以是方法、设备、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
[0087] 计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号
[0088] 这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0089] 用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实现中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
[0090] 这里参照根据本公开实现的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0091] 这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0092] 也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0093] 附图中的流程图和框图显示了根据本公开的多个实现的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0094] 以上已经描述了本公开的各实现,上述说明是示例性的,并非穷尽性的,并且也不限于所公开的各实现。在不偏离所说明的各实现的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实现的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文公开的各实现。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈