首页 / 专利库 / 电脑零配件 / 固件 / 基本输入输出系统 / 一种存储资源管理的系统及方法

一种存储资源管理的系统及方法

阅读:226发布:2020-05-08

专利汇可以提供一种存储资源管理的系统及方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种存储资源管理的系统及方法,其中所述系统包括:机柜管理板RMC,用于根据接收到的自我监测分析和报告技术SMART信息、串行连接小型 计算机系统 接口 SAS拓扑信息以及 硬盘 信息中的一种或多种,管理存储资源;与所述RMC连接的 服务器 节点 板,用于获取所述SMART信息,并上报至所述RMC;与所述RMC连接的交换节点板,用于获取所述SAS拓扑信息,并上报至所述RMC;与所述RMC连接的存储节点板,用于获取所述硬盘信息,并上报至所述RMC,其中所述存储节点板包括:连接于所述RMC的存储节点板中的第一 基板 管理 控制器 BMC、分别连接于所述第一BMC上的简单硬盘簇JBOD,其中所述第一BMC,用于管理从所述JBOD获取的硬盘信息。,下面是一种存储资源管理的系统及方法专利的具体信息内容。

1.一种存储资源管理的系统,其特征在于,包括:
机柜管理板RMC,用于根据接收到的自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息中的一种或多种,管理存储资源;所述RMC还用于在获取第一硬盘的分配请求,解析所述分配请求中所述第一硬盘的端口及容量信息;
根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区;
与所述RMC连接的服务器节点板,用于获取所述SMART信息,并上报至所述RMC;
与所述RMC连接的交换节点板,用于获取所述SAS拓扑信息,并上报至所述RMC;
与所述RMC连接的存储节点板,用于获取所述硬盘信息,并上报至所述RMC,其中所述存储节点板包括:连接于所述RMC的存储节点板中的第一基板管理控制器BMC、连接于所述第一基板管理控制器BMC上的简单硬盘簇JBOD,其中所述第一基板管理控制器BMC,用于管理从所述JBOD获取的硬盘信息。
2.根据权利要求1所述的存储资源管理的系统,其特征在于,所述服务器节点板包括:
连接于所述RMC的服务器节点板中的第二基板管理控制器BMC、分别带外管理连接于所述第二基板管理控制器BMC上的主机总线适配器HBA、基本输入输出系统BIOS以及温度传感器,其中,所述第二基板管理控制器BMC,用于管理所述HBA记录的所述SMART信息中的温度信息。
3.根据权利要求1所述的存储资源管理的系统,其特征在于,所述交换节点板包括:连接于所述RMC的交换节点板中的第三基板管理控制器BMC、分别带外管理连接于所述第三基板管理控制器BMC上的串行连接小型计算机系统接口交换SAS Switch以及温度传感器,其中,所述第三基板管理控制器BMC,用于管理从所述SAS Switch获取的SAS拓扑信息。
4.根据权利要求1或3所述的存储资源管理的系统,其特征在于,所述SAS拓扑信息包括HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
5.根据权利要求1所述的存储资源管理的系统,其特征在于,所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
6.根据权利要求1所述的存储资源管理的系统,其特征在于,
所述RMC还用于在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
7.根据权利要求1所述的存储资源管理的系统,其特征在于,
所述第一基板管理控制器BMC还用于获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
8.根据权利要求1所述的存储资源管理的系统,其特征在于,
所述第一基板管理控制器BMC还用于获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
9.一种存储资源管理的方法,其特征在于,包括:
服务器节点板获取自我监测分析和报告技术SMART信息,并上报至机柜管理板RMC;
交换节点板获取串行连接小型计算机系统接口SAS拓扑信息,并上报至所述RMC;
存储节点板获取硬盘信息,并上报至所述RMC,其中所述存储节点板包括:连接于所述RMC的存储节点板中的第一基板管理控制器BMC、连接于所述第一基板管理控制器BMC上的简单硬盘簇JBOD,其中所述第一基板管理控制器BMC,用于管理从所述JBOD获取的硬盘信息;
所述RMC根据接收到的所述SMART信息、所述SAS拓扑信息以及所述硬盘信息中的一种或多种,管理存储资源;
所述RMC在获取第一硬盘的分配请求,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
10.根据权利要求9所述的存储资源管理的方法,其特征在于,所述服务器节点板包括:
连接于所述RMC的服务器节点板中的第二基板管理控制器BMC、分别带外管理连接于所述第二基板管理控制器BMC上的主机总线适配器HBA、基本输入输出系统BIOS以及温度传感器,其中,所述第二基板管理控制器BMC管理所述HBA记录的所述SMART信息中的温度信息。
11.根据权利要求9所述的存储资源管理的方法,其特征在于,所述交换节点板包括:连接于所述RMC的交换节点板中的第三基板管理控制器BMC、分别带外管理连接于所述第三基板管理控制器BMC上的串行连接小型计算机系统接口交换SAS Switch以及温度传感器,其中,所述第三基板管理控制器BMC,用于管理从所述SAS Switch获取的SAS拓扑信息。
12.根据权利要求9或11所述的存储资源管理的方法,其特征在于,所述SAS拓扑信息包括HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
13.根据权利要求9所述的存储资源管理的方法,其特征在于,所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
14.根据权利要求9所述的存储资源管理的方法,其特征在于,
所述RMC在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
15.根据权利要求9所述的存储资源管理的方法,其特征在于,
所述第一基板管理控制器BMC获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
16.根据权利要求9所述的存储资源管理的方法,其特征在于,
所述第一基板管理控制器BMC获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
17.根据权利要求10所述的存储资源管理的方法,其特征在于,
所述RMC发送查询第三硬盘运行状态的命令给所述第二基板管理控制器BMC;
所述RMC接收到由所述第二基板管理控制器BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘实际温度,调控整体的散热系统;
所述RMC接收到由所述第二基板管理控制器BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘的运行状态,判断所述第三硬盘的是否发生故障硬盘;
所述RMC在所述第三硬盘发生故障之后,告警并隔离。

说明书全文

一种存储资源管理的系统及方法

技术领域

[0001] 本发明涉及存储技术,特别是涉及一种存储资源管理的系统及方法。

背景技术

[0002] 数据中心对存储容量需求呈几何级数增长,而传统刀片服务器使用本地存储已经不能满足市场需求,为此诞生了机柜式服务器,服务器上只保留少量存储存放版本和日志,而把存储资源独立出来作为一个资源池来统一管理,所有服务器可以共享存储资源池。
[0003] SAS(Serial Attached SCSI,串行连接SCSI,其中SCSI(Small Computer System Interface,小型计算机系统接口))是存储网络中使用最广泛的一种硬盘连接技术,以串行通讯为协议基础架构,采用SCSI-3扩展指令集,综合了现有并行SCSI和串行连接技术的优势,并能兼容SATA设备。SAS具备当前硬盘通道技术里面的最高接口速率,SAS3.0标准的速率达到12Gb/s,SAS特有的宽端口技术,使得传输带宽得到成倍的提升,以12Gbps SAS通道为例,4*SAS宽端口带宽可达48Gbps。
[0004] 当多个SAS设备需要互相通信时,必须通过SAS expander扩展器连接。SAS expander具有多个SAS端口,内置MIPS(Million Instructions Per Second,单字长定点指令平均执行速度)处理器,根据功能分为SAS switch交换和JBOD(Just Bundle of Disk,简单硬盘簇),其中JBOD只是做硬盘扩展,把若干个硬盘连在一起组成一个大的逻辑硬盘。SAS Switch连接若干个JBOD形成一个SAS交换域,通过SAS Switch就可以管理整个SAS交换域。
[0005] 图1是一个典型的机柜服务器系统,机柜内置JBOD,若干个server服务器通过SAS switch连接JBOD。
[0006] 机柜服务器系统具有以下特点:1、传输隔离:隔离server和存储资源,防止非法访问。2、访问控制:限制每个server可以访问的存储资源,如图1中,每个server只能访问JBOD的部分硬盘;3、灵活的资源分配:如果某个server需要更多的资源,可以分配新的硬盘。为此,ANSI(美国国家标准学会)T10技术委员会提出了SAS zoning区域技术,类似于以太网的VLAN(Virtual Local Area Network,虚拟局域网)技术,SAS switch和JBOD组成的SAS交换域划分为不同的ZONE(分区),不同ZONE之间互不可见。图1中,server1和若干个硬盘划分为ZONE1,server1只能访问ZONE1中的硬盘,如果需要更多的硬盘,只需要把新的硬盘加入到ZONE1即可。SAS zoning具体是通过SAS expander中的ZPT表(Zoning Permission Table,分区权限表)来控制不同ZONE之间是否可以通信。
[0007] 机柜服务器系统中存在两个通信平面,分别是数据平面和管理平面。数据平面采用带内通道(SAS)互联,目前的组网通常采用多路径冗余设计,网络中至少有两个交换节点,JBOD内有两个SAS expander连接硬盘的两个端口,每个交换节点与server和JBOD交叉互联,server上运行主机多路径软件来实现多条IO路径的链路冗余和负载均衡。管理平面通常分为带内管理和带外管理,带内管理使用HBA(Host Bus Adapter,主机总线适配器)管理SAS expander,通过SES(SCSI Enclosure Services)协议实现箱体管理,带外管理通道有eth(以太网)、UART(Universal Asynchronous Receiver/Transmitter,通用异步收发传输器或异步收发传输器)或I2C(Inter-Integrated Circuit,两线式串行总线)等。由于HBA的硬件成本昂贵,因此交换节点通常采用带外管理。图1显示的是管理客户端5(PC)通过带外通道连接其中一个SAS switch,在管理客户端5上提供web GUI(Graphical User Interface,图形用户界面),通过图形化界面管理server使用的存储资源。
[0008] 图2是现有机柜服务器系统常见的一种管理平面,HBA24,JBOD42均与SAS Switch32连接,BMC21,31,41(Board Management Controller,基板管理控制器)提供带外监管、固件管理和传感器23,33,43管理等。服务器节点板2上的BMC21负责传感器23功能,通过与BIOS22(Basic Input Output System,基本输入输出系统)进行数据交换,获取单板的系统信息,接收来自BIOS22的系统事件,上报给RMC1(Rack Management Controller,机柜管理板)。交换节点板3的BMC31只传感器33管理,SAS Switch32通过带外通道直接与RMC1通信。存储节点板4的BMC41只负责传感器43功能,JBOD42只有带内通道连接交换节点板3。

发明内容

[0009] 本发明实施例的目的在于提供一种存储资源管理的系统及方法,可以直接获取JBOD存储资源,提高传递效率。
[0010] 为了实现上述目的,本发明实施例提供的一种存储资源管理的系统,包括:
[0011] 机柜管理板RMC,用于根据接收到的自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息中的一种或多种,管理存储资源;
[0012] 与所述RMC连接的服务器节点板,用于获取所述SMART信息,并上报至所述RMC;
[0013] 与所述RMC连接的交换节点板,用于获取所述SAS拓扑信息,并上报至所述RMC;
[0014] 与所述RMC连接的存储节点板,用于获取所述硬盘信息,并上报至所述RMC,其中所述存储节点板包括:连接于所述RMC的存储节点板中的第一基板管理控制器BMC、连接于所述第一BMC上的简单硬盘簇JBOD,其中所述第一BMC,用于管理从所述JBOD获取的硬盘信息。
[0015] 其中所述的存储资源管理的系统中,
[0016] 所述服务器节点板包括:连接于所述RMC的服务器节点板中的第二基板管理控制器BMC、分别带外管理连接于所述第二BMC上的主机总线适配器HBA、基本输入输出系统BIOS以及温度传感器,其中,所述第二BMC,用于管理所述HBA记录的所述SMART信息中的温度信息。
[0017] 其中所述的存储资源管理的系统中,
[0018] 所述交换节点板包括:连接于所述RMC的交换节点板中的第三基板管理控制器BMC、分别带外管理连接于所述第三BMC上的串行连接小型计算机系统接口交换SAS Switch以及温度传感器,其中,所述第三BMC,用于管理从所述SAS Switch获取的SAS拓扑信息。
[0019] 其中所述的存储资源管理的系统中,
[0020] 所述SAS拓扑信息包括所述HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
[0021] 其中所述的存储资源管理的系统中,
[0022] 所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
[0023] 其中所述的存储资源管理的系统中,
[0024] 所述RMC还用于在获取第一硬盘的分配请求,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[0025] 其中所述的存储资源管理的系统中,
[0026] 所述RMC还用于在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[0027] 其中所述的存储资源管理的系统中,
[0028] 所述第一BMC还用于获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[0029] 其中所述的存储资源管理的系统中,
[0030] 所述第一BMC还用于获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[0031] 本发明实施例还提供一种存储资源管理的方法中,包括:
[0032] 服务器节点板获取自我监测分析和报告技术SMART信息,并上报至机柜管理板RMC;
[0033] 交换节点板获取串行连接小型计算机系统接口SAS拓扑信息,并上报至所述RMC;
[0034] 存储节点板获取硬盘信息,并上报至所述RMC,其中所述存储节点板包括:连接于所述RMC的存储节点板中的第一基板管理控制器BMC、连接于所述第一BMC上的简单硬盘簇JBOD,其中所述第一BMC,用于管理从所述JBOD获取的硬盘信息;
[0035] 所述RMC根据接收到的所述SMART信息、所述SAS拓扑信息以及所述硬盘信息中的一种或多种,管理存储资源。
[0036] 其中所述的存储资源管理的方法中,
[0037] 所述服务器节点板包括:连接于所述RMC的服务器节点板中的第二基板管理控制器BMC、分别带外管理连接于所述第二BMC上的主机总线适配器HBA、基本输入输出系统BIOS以及温度传感器,其中,所述第二BMC管理所述HBA记录的所述SMART信息中的温度信息。
[0038] 其中所述的存储资源管理的方法中,
[0039] 所述交换节点板包括:连接于所述RMC的交换节点板中的第三基板管理控制器BMC、分别带外管理连接于所述第三BMC上的串行连接小型计算机系统接口交换SAS Switch以及温度传感器,其中,所述第三BMC,用于管理从所述SAS Switch获取的SAS拓扑信息。
[0040] 其中所述的存储资源管理的方法中,
[0041] 所述SAS拓扑信息包括所述HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
[0042] 其中所述的存储资源管理的方法中,
[0043] 所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
[0044] 其中所述的存储资源管理的方法中,
[0045] 所述RMC在获取第一硬盘的分配请求,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[0046] 其中所述的存储资源管理的方法中,
[0047] 所述RMC在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[0048] 其中所述的存储资源管理的方法中,
[0049] 所述第一BMC获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[0050] 其中所述的存储资源管理的方法中,
[0051] 所述第一BMC获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[0052] 其中所述的存储资源管理的方法中,
[0053] 所述RMC发送查询第三硬盘运行状态的命令给所述第二BMC;
[0054] 所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘实际温度,调控整体的散热系统;
[0055] 所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘的运行状态,判断所述第三硬盘的是否发生故障硬盘;
[0056] 所述RMC在所述第三硬盘发生故障之后,告警并隔离。
[0057] 本发明实施例的上述技术方案的有益效果如下:
[0058] 本发明实施例的方案中,通过直接分别从服务器节点板、交换节点板及存储节点板获取自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息进行管理,本发明实施例对现有机柜服务器系统的管理平面进行了优化,使用第一BMC实现带外资源管理和分配,并且通过存储节点板的第一BMC管理JBOD,可以直接获取JBOD存储资源,简化了SAS Switch的软件复杂度,提高了传递效率。附图说明
[0059] 图1为现有SAS Zoning原理图;
[0060] 图2为现有机柜服务器系统管理平面示意图;
[0061] 图3为本发明实施例机柜服务器系统管理平面示意图;
[0062] 图4为本发明实施例存储资源分配示意图;
[0063] 图5为本发明实施例存储资源管理状态机;
[0064] 图6为本发明实施例的存储资源管理的方法的步骤示意图。

具体实施方式

[0065] 为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0066] 本发明实施例针对现有技术中SAS Switch32直接和RMC1连接,再将交换节点板3中的BMC31和RMC1连接,只能从交换节点板3中的BMC31获取到传感器43信息,并不能获取到资源管理信息的问题,还有现有通过SAS switch32转发JBOD42给RMC1,不仅效率差,而且条件要求较高的问题。
[0067] 本发明实施例提供一种存储资源管理的系统及方法,将BMC分别与JBOD和HBA连接,就可得到资源管理信息以及传感器信息,实现了直接获取资源,进行管理,并且减少了RMC的软件复杂度,而且通过BMC转发JBOD安全可靠,效率高。
[0068] 如图3和图4所示,本发明实施例提供的存储资源管理的系统,包括:
[0069] 机柜管理板RMC31,用于根据接收到的自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息中的一种或多种,管理存储资源;
[0070] 与所述RMC31连接的服务器节点板32,用于获取所述SMART信息,并上报至所述RMC31;
[0071] 与所述RMC31连接的交换节点板33,用于获取所述SAS拓扑信息,并上报至所述RMC31;
[0072] 与所述RMC31连接的存储节点板34,用于获取所述硬盘信息,并上报至所述RMC31,其中所述存储节点板34包括:连接于所述RMC的存储节点板中的第一基板管理控制器BMC341、连接于所述第一BMC341上的简单硬盘簇JBOD342,其中所述第一BMC341,用于管理从所述JBOD342获取的硬盘信息。
[0073] 本发明实施例中,通过直接分别从服务器节点板32、交换节点板33及存储节点板34获取自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息进行管理,比起传统的图2中RMC1获取JBOD42的硬盘信息(RMC1对JBOD42的管理需要SAS switch32进行带外到带内的转换,在获取存储资源信息时,SAS switch32需要先解析带外管理命令,转换成SCSI命令发送给JBOD42,并且对SAS switch32软件要求较高,很多功能需要特殊定制)的问题来说,本发明实施例对现有机柜服务器系统的管理平面进行了优化,使用第一BMC341实现带外资源管理和分配,并且通过存储节点板的第一BMC341管理JBOD342,可以直接获取JBOD342存储资源,简化了SAS Switch的软件复杂度,提高了传递效率。
[0074] 需要说明的是:如图3所示,所述存储节点板34还包括:连接于所述第一BMC341上温度传感器343,其中所述存储节点板34可以配置一或者多块。
[0075] 上述存储节点板上的JBOD以及SAS expander自动拓扑发现SAS交换域中的所有硬盘的信息,包括连接SAS expander的Port ID、SAS地址、设备类型、接口类型、容量、硬盘序列号等。
[0076] 还有上述简单硬盘簇JBOD包括串行连接小型计算机系统接口扩展器SAS expander以及硬盘。
[0077] 与所述第一BMC连接的JBOD以及温度传感器均是通过带外管理连接,其中所述带外管理连接包括但不限于以太网、UART(Universal Asynchronous  Receiver/Transmitter,通用异步收发传输器或异步收发传输器)、I2C(Inter-Integrated Circuit,两线式串行总线),具体的连接对应取决于HBA、SAS switch以及SAS expander芯片能,并且上述与所述RMC连接的服务器节点板,交换节点板以及存储节点板均通过以太网进行连接。
[0078] 还有,上述SAS拓扑信息包括所述HBA连接SAS Switch的端口号Port ID、所述SAS的地址。上述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
[0079] 另外,上述的SMART(Self Monitoring Analysis and Reporting Technology,自我监测分析和报告技术)信息是具有硬盘的运行时间,运行参数,运行温度等信息,用于记录硬盘的状态;通过查询硬盘的SMART信息直接得到信息,不影响系统散热效果,也方便可靠的监测硬件温度。
[0080] 上述RMC,作为系统中的机柜管理节点,通过以太网交换汇聚了所有节点板的BMC,组成所述机柜服务器系统的管理平面。
[0081] 管理客户端35,作为系统中的网管后台,以太网连接RMC,负责整个服务器机柜节点板的版本管理、故障管理和资源管理等。提供web GUI,用户可以图形化管理所述机柜服务器系统中的存储资源。
[0082] 还有,机柜管理板RMC如果仅仅是SMART信息、SAS拓扑信息以及硬盘信息中的一种信息,则说明其他没有上报信息的路径出现异常,就可以实现异常的IO路径检测,针对传统的RMC对硬盘的检测不能覆盖完整的服务器节点的IO路径(如图2中RMC并不能发现HBA和SAS Switch之间出现的断链),本发明实施例能够实现故障硬盘隔离更换功能。
[0083] 如图3所示,为了实现HBA324记录的所述SMART信息中的温度信息上报给RMC,本发明实施例的存储资源管理的系统中,所述服务器节点板包括:连接于所述RMC的服务器节点板中的第二基板管理控制器BMC321、分别带外管理连接于所述第二BMC321上的主机总线适配器HBA324、基本输入输出系统BIOS322以及温度传感器323,其中,所述第二BMC321,用于管理所述HBA324记录的所述SMART信息中的温度信息。
[0084] 本发明实施例中,所述服务器节点板的第二BMC管理HBA,可以弥补SAS expander带外管理通道无法直接获取硬盘的SMART信息的缺陷
[0085] 需要说明的是:所述服务器节点板可以配置一块或者多块,通过所述第二BMC监控硬盘状态,检测所述服务器节点的IO路径,并根据硬盘实际温度调节散热系统,隔离故障硬盘。
[0086] 如图3所示,为了实现从SAS Switch332获取的SAS拓扑信息上报给RMC,本发明实施例的存储资源管理的系统中,所述交换节点板包括:连接于所述RMC的交换节点板中的第三基板管理控制器BMC331、分别带外管理连接于所述第三BMC331上的串行连接小型计算机系统接口交换SAS Switch332以及温度传感器333,其中,所述第三BMC331,用于管理从所述SAS Switch332获取的SAS拓扑信息。
[0087] 本发明实施例中,所述交换节点板的第三BMC管理SAS Switch,对RMC屏蔽了不同厂家SAS Switch的差异。
[0088] 需要说明的是:上述所述交换节点板至少配置两块构成多路径冗余设计,并且连接于第三BMC上的SAS  Switch自动拓扑发现SAS交换域中的所有SAS device和SAS expander的信息,包括HBA连接SAS Switch的Port ID、SAS地址。
[0089] 为了能够通过RMC管理SAS Switch一端来管理所有资源,将所述存储节点板上的JBOD、所述HBA均与SAS Switch连接,所述第一BMC、第三BMC与第二BMC均与RMC连接,因此可以通过RMC管理SAS Switch一端来管理所有资源,避免了如图2的RMC与HBA以及JBOD没有连接,无法进行管理的问题。本发明实施例中具体的检测方法如下:
[0090] 步骤101:RMC下发命令给服务器节点板中的第二BMC,检测IO路径。
[0091] 步骤102:第二BMC命令HBA通过SCSI命令获取交换节点板SAS Switch的SAS地址。如果获取失败,上报异常。
[0092] 步骤103:第二BMC命令HBA通过SCSI命令获取存储节点板SAS expander的SAS地址。如果获取失败,上报异常。
[0093] 步骤104:第二BMC命令HBA通过SCSI命令获取存储节点板硬盘序列号。如果获取失败,上报异常。
[0094] 本发明实施例的系统平面示意。
[0095] 为便于描述如图4所示,只显示两个服务器节点板32、一个交换节点板33和两个存储节点板34。譬如两块存储节点板34共有3个硬盘,用户希望在初始态,所有服务器节点板看不到任何硬盘,由RMC根据用户配置把硬盘分配给具体的服务器节点板32,譬如硬盘HDD1(Hard Disk Drive,硬盘驱动器)分配给HBA1,硬盘HDD2分配给HBA2。未分配的硬盘称为无主盘,图4中硬盘HDD3为无主盘。因为服务器节点板的槽位是固定的,HBA连接SAS Switch的端口也是确定的,SAS Switch不用关心该槽位服务器节点板是否在位,初始化时分配好所有服务器节点板槽位的ZONE,服务器节点板在上电后就可以看到被分配的硬盘。
[0096] 为了实现资源分配,本发明实施例的存储资源管理的系统中,所述RMC在获取第一硬盘的分配请求,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[0097] 本发明实施例中,在服务器节点没有加电前实现动态资源分配,采用的存储资源分配方法,只需要在初始化时同步一次ZPT表,后续SAS拓扑发生变化时,通过更改硬盘对应SAS PHY的组识别码group ID即可方便的实现SAS zoning配置。
[0098] 需要说明的是:通过所述SAS Switch设置服务器节点ZONE和伙伴硬盘ZONE,所述服务器节点ZONE是指交换节点板SAS Switch对应服务器节点板槽位的SAS PHY(Physical Layer,物理层)的属性组group ID,譬如SAS Switch修改HBA1对应的端口P1的group ID为group 8(SAS Zoning规定group0~7为保留group),修改HBA2对应的端口P2的group ID为group9。所述伙伴硬盘ZONE是指所述服务器节点可以通信的ZONE。譬如HBA1的伙伴存储节点ZONE为group64,HBA2的伙伴存储节点ZONE为group65。
[0099] SAS expander设置所有硬盘归属同一个缺省ZONE,通常选择一个保留group作为缺省ZONE。譬如SAS expander1设置硬盘HDD1对应的端口P3的group ID为group0,SAS expander2设置硬盘HDD2对应的端口P4的group ID为group0,硬盘HDD3对应的端口P5的group ID为group0。
[0100] 还有,所述预先建立是指所述交换节点板SAS Switch在初始化时设置服务器节点板ZONE和伙伴硬盘ZONE,使得所述服务器节点板ZONE与伙伴硬盘ZONE是一一对应的关系。
[0101] 所述存储节点板SAS expander设置所有硬盘归属于同一个缺省ZONE。
[0102] 所述SAS Switch设置ZPT表,只允许所述服务器节点板ZONE与伙伴硬盘ZONE通信。
[0103] 所述SAS Switch在拓扑发现时把ZPT同步给所有SAS expander。
[0104] SAS Switch创建ZPT表(协议要用到这个表进行划分通信),服务器节点ZONE和伙伴硬盘ZONE建立通信。譬如SAS Switch创建的ZPT表如下表1所示。
[0105]
[0106] ZPT表的X轴表示源ZONE,Y轴表示目的ZONE,ZP(X,Y)为0表示groupX和groupY不能通信,1表示groupX和groupY能通信。M表示最大group,与SAS expander芯片能力有关,一般支持128个group。图4实例把ZP(8、64)和ZP(64、8)都设置为1使得group8和group64可以互相通信,把ZP(9、65)和ZP(65、9)都设置为1使得group9和group65可以互相通信。
[0107] SAS Switch把ZPT同步给SAS expander,譬如SAS Switch1和SAS Switch2把ZPT同步给SAS expander1和SAS expander2。
[0108] 本发明实施例的具体实现过程如下。
[0109] 步骤201:用户在管理客户端35给服务器节点板分配硬盘,譬如HBA1分配硬盘HDD1,给HBA2分配硬盘HDD2,下发命令给RMC。
[0110] 步骤202:RMC下发命令给第一BMC。
[0111] 步骤203:第一BMC命令SAS expander修改伙伴硬盘ZONE。所述伙伴硬盘ZONE是指存储节点板SAS expander对应硬盘SAS PHY属性的group ID。譬如SAS expander1修改硬盘HDD1对应的端口P3的group ID为group64,SAS expander2修改硬盘HDD2对应的端口P4的group ID为group65。
[0112] 步骤204:资源分配成功,RMC保存用户数据。
[0113] 对于本发明实施例中,需要先上报硬件资源,再根据用户配置给服务器节点分配硬件,先将硬盘加载group 0就是默认组,在判断硬件容量以及接口信息机上报资源给RMC,RMC根据上报信息将硬盘分配为服务的伙伴ZONE的group ID(即将原有的group 0修改为group 64),这样就可以得到通过RMC转发的用户客户端指令所需的服务器以及容量大小。
[0114] 为了实现将分配的资源删除,本发明实施例的存储资源管理的系统中,[0115] 所述RMC还用于在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[0116] 本发明实施例的具体实现过程如下。
[0117] 步骤301:用户在管理客户端35删除分配给服务器节点板的硬盘,譬如删除分配给HBA1的硬盘HDD1,下发命令给RMC。
[0118] 步骤302:RMC下发命令给第一BMC。
[0119] 步骤303:第一BMC命令SAS expander把硬盘退出伙伴存储节点ZONE,譬如SAS expander1修改硬盘HDD1对应的端口P3的group ID为group0(0到9),退出group64。
[0120] 为了方便用户维护或者更换硬盘,进而拔出硬盘,本发明实施例的存储资源管理的系统中,所述第一BMC还用于获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[0121] 为了方便用户增加硬盘或者更换硬盘,进而插入新的硬盘,本发明实施例的存储资源管理的系统中,所述第一BMC还用于获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[0122] 需要说明的是:上述预设默认分区为group0。
[0123] 还有,如图5所示,本发明实施例中所述RMC可以实现上述多种功能,硬盘管理,资源删除,IO路径检测,硬盘插入等功能。
[0124] 如图6所示,本发明实施例提供一种存储资源管理的方法,包括:
[0125] 步骤61,服务器节点板获取自我监测分析和报告技术SMART信息,并上报至机柜管理板RMC;
[0126] 步骤62,交换节点板获取串行连接小型计算机系统接口SAS拓扑信息,并上报至所述RMC;
[0127] 步骤63,存储节点板获取硬盘信息,并上报至所述RMC,其中所述存储节点板包括:连接于所述RMC的存储节点板中的第一基板管理控制器BMC、连接于所述第一BMC上的简单硬盘簇JBOD,其中所述第一BMC,用于管理从所述JBOD获取的硬盘信息;
[0128] 步骤64,所述RMC根据接收到的所述SMART信息、所述SAS拓扑信息以及所述硬盘信息中的一种或多种,管理存储资源。
[0129] 本发明实施例中,通过直接分别从服务器节点板、交换节点板及存储节点板获取自我监测分析和报告技术SMART信息、串行连接小型计算机系统接口SAS拓扑信息以及硬盘信息进行管理,从而本发明实施例对现有机柜服务器系统的管理平面进行了优化,使用第一BMC实现带外资源管理和分配,并且通过存储节点板的第一BMC管理JBOD,可以直接获取JBOD存储资源,简化了SAS Switch的软件复杂度,提高了传递效率。
[0130] 为了更好的获得拓扑信息,本发明获取拓扑信息的具体流程举例如下:
[0131] 步骤401,第三BMC向SAS Switch获取SAS拓扑信息,譬如SAS Switch获取HBA1和HBA2的端口信息、连接SAS expander1和SAS expander 2的端口信息。
[0132] 步骤402:第三BMC向RMC上报SAS拓扑信息。
[0133] 步骤403:RMC汇总所有交换节点板上报的SAS拓扑,譬如对板SAS Switch分别上报的SAS拓扑,如果不一致则告警,并选择最优拓扑。
[0134] 步骤404:第一BMC向SAS expander获取SAS拓扑信息,譬如SAS expander1和SAS expander 2获取SAS拓扑信息,包括硬盘的端口信息、容量、设备类型、接口类型。
[0135] 步骤405:第一BMC向RMC上报SAS拓扑。
[0136] 步骤406:RMC汇总所有存储节点板上报的SAS拓扑,譬如对比SAS expander 1和SAS expander 2分别上报的SAS拓扑,如果不一致则告警,并选择最优拓扑(所述最优拓扑是指数字最高,比如是通过一个SAS expander1检测到3个硬盘,一个SAS expander2检测到2个硬盘,为了避免遗漏硬盘,因此按照3个硬盘。具有SAS expander1以及SAS expander2两个,防止一个出错后,另一个可以保证业务,此处是为了选择最优拓扑,一般一个也可以满足要求)。
[0137] 本发明的又一实施例的存储资源管理的方法中,所述服务器节点板包括:连接于所述RMC的服务器节点板中的第二基板管理控制器BMC、分别带外管理连接于所述第二BMC上的主机总线适配器HBA、基本输入输出系统BIOS以及温度传感器,其中,所述第二BMC管理所述HBA记录的所述SMART信息中的温度信息。
[0138] 本发明实施例中,所述服务器节点板中的第二BMC管理HBA,可以弥补SAS expander带外管理通道无法直接获取硬盘的SMART信息的缺陷。
[0139] 本发明的又一实施例的存储资源管理的方法中,所述交换节点板包括:连接于所述RMC的交换节点板中的第三基板管理控制器BMC、分别带外管理连接于所述第三BMC上的串行连接小型计算机系统接口交换SAS Switch以及温度传感器,其中,所述第三BMC,用于管理从所述SAS Switch获取的SAS拓扑信息。
[0140] 本发明实施例中,所述交换节点板中的第三BMC管理SAS Switch,对RMC屏蔽了不同厂家SAS Switch的差异。
[0141] 本发明的又一实施例的存储资源管理的方法中,所述SAS拓扑信息包括所述HBA连接SAS Switch的端口号Port ID、所述SAS的地址。
[0142] 本发明实施例中,将第一BMC、第二BMC分别与JBOD和HBA连接,所述第一BMC管理JBOD,也可以直接获取JBOD存储资源,简化了SAS Switch的软件复杂度。
[0143] 本发明的又一实施例的存储资源管理的方法中,所述硬盘信息包括硬盘的端口信息、容量、设备类型以及接口类型。
[0144] 本发明的又一实施例的存储资源管理的方法中,所述RMC在获取第一硬盘的分配请求,解析所述分配请求中所述第一硬盘的端口及容量信息;根据所述第一硬盘的端口及所述容量信息,将所述第一硬盘的端口加入到,与所述第一硬盘容量匹配的伙伴硬盘分区,其中所述伙伴硬盘分区为与服务器节点板分区预先建立一一对应关系的分区。
[0145] 本发明采用的存储资源分配方法,只需要在初始化时同步一次ZPT表,后续SAS拓扑发生变化时,通过更改硬盘对应SAS PHY(Physical layer,物理层)的group ID即可方便的实现SAS zoning配置。
[0146] 本发明的又一实施例的存储资源管理的方法中,所述RMC在所述第一硬盘已分配之后,获取一删除分配请求,根据所述删除分配请求,将所述第一硬盘退出伙伴硬盘分区。
[0147] 本发明的又一实施例的存储资源管理的方法中,所述第一BMC获取到第二硬盘拔出事件,将所述第二硬盘拔出事件上报给所述RMC,由所述RMC进行第二硬盘信息的删除。
[0148] 本发明的又一实施例的存储资源管理的方法中,所述第一BMC获取到第二硬盘插入事件,将所述第二硬盘分配给预设默认分区,并将所述插入事件上报给所述RMC。
[0149] 本发明的又一实施例的存储资源管理的方法中,
[0150] 所述RMC发送查询第三硬盘运行状态的命令给所述第二BMC;
[0151] 所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘实际温度,调控整体的散热系统;
[0152] 所述RMC接收到由所述第二BMC反馈所述HBA中的SMATR信息,并根据所述SMATR信息中的所述第三硬盘的运行状态,判断所述第三硬盘的是否发生故障硬盘;
[0153] 所述RMC在所述第三硬盘发生故障之后,告警并隔离。
[0154] 本发明实施例中,能够根据硬盘温度动态调节系统散热并对硬盘的运行状态进行监测。
[0155] 需要说明的是:上述的SMART信息是具有硬盘的运行时间,运行参数,运行温度等信息,用于记录硬盘的状态。
[0156] 对于RMC的硬盘管理的流程举例如下:
[0157] 步骤501:RMC下发命令给第二BMC,查询硬盘运行状态。
[0158] 步骤502:服务器节点板中的第二BMC命令HBA查询硬盘的SMART信息。
[0159] 步骤503:RMC获取到硬盘的运行状态。
[0160] 步骤504:RMC根据硬盘实际温度调控散热系统。
[0161] 步骤505:RMC发现故障盘(和正常参数不同),告警并隔离(就是退出硬盘)。
[0162] 本发明实施例中,针对传统的通过单个传感器的数据进行温度数据的上报数据的误差(具体的由于存储板较多,对应的每个存储板上不能都有传感器,或者每个传感器上距离每个存储板的距离远近也会影响测量数据,使得存储节点通过温度传感器监测的硬盘温度与硬盘内部的实际温度存在误差,影响系统散热效果以及缩短硬盘寿命的问题。如图2中只有服务器节点中的HBA可以作为SAS initiator Device(发起者的装置)通过SCSI(Small Computer System Interface,小型计算机系统接口)协议去获取。交换节点的带外通道是无法直接获取SMART信息的,但是服务器节点通常采用商用OS(Operation System,操作系统),不便直接增加应用程序去控制HBA。)本发明实施例通过查询硬盘的SMART信息直接得到信息,不影响系统散热效果,也方便可靠的监测硬件温度。
[0163] 需要说明的是,本发明提供的装置是应用上述存储资源管理的方法的装置,则上述存储资源管理的方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
[0164] 以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈