首页 / 专利库 / 人工智能 / 嵌入式计算 / 对冷却模块进行潜在故障检查的方法

对冷却模进行潜在故障检查的方法

阅读:245发布:2024-01-03

专利汇可以提供对冷却模进行潜在故障检查的方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种对 嵌入式计算 机机箱的冷却模 块 进行潜在故障检查的方法,包括在检测到冷却模块中的活跃故障之前,执行 风 扇 控制器 潜在故障检查 算法 (242)和全速潜在故障检查算法(240)。风扇控制器潜在故障检查算法可以包括试图经由冷却模块中的风扇控制器模块 修改 冷却模块中的风扇速度,以及确定是否检测到风扇速度的变化。全速潜在故障检查算法(240)可以包括试图避过风扇控制器模块(232),经由全速风扇控制 电路 修改风扇速度,以及确定是否检测到风扇速度的变化。如果在风扇控制器潜在故障检查算法(242)和全速潜在故障检查算法(240)中的至少一个中没有检测到风扇速度变化,则指示嵌入式计算机机箱的冷却模块(232)中存在潜在故障。,下面是对冷却模进行潜在故障检查的方法专利的具体信息内容。

1.一种对嵌入式计算机机箱的冷却模进行潜在故障检查的方 法,其包括:
在检测到所述冷却模块中的活跃故障之前,执行控制器潜在 故障检查算法和全速潜在故障检查算法,所述风扇控制器潜在故障检 查算法包括:
试图经由所述冷却模块中的风扇控制器模块修改所述冷却模块中 的风扇速度;
确定是否检测到所述风扇速度的变化;
所述全速潜在故障检查算法包括:
试图避过所述风扇控制器模块,经由全速风扇控制电路修改所述 风扇速度;
确定是否检测到所述风扇速度的变化;
以及
如果在所述风扇控制器潜在故障检查算法和所述全速潜在故障检 查算法中的至少一个中没有检测到所述风扇速度的变化,则指示所述 嵌入式计算机机箱的所述冷却模块中存在潜在故障。
2.如权利要求1所述的方法,所述风扇控制器潜在故障检查算法 进一步包括:
传送增加风扇速度的信号
确定是否检测到风扇速度增加;
传送降低风扇速度的信号;
确定是否检测到风扇速度降低;以及
如果没有检测到风扇速度增加和风扇速度降低中的至少一种,则 指示所述嵌入式计算机机箱的所述冷却模块中存在潜在故障。
3.如权利要求2所述的方法,其中总线主模块命令所述风扇控制 器模块修改所述风扇速度。
4.如权利要求3所述的方法,其中所述总线主模块经由智能平台 管理总线(IPMB)命令所述风扇控制器模块。
5.如权利要求1所述的方法,所述全速潜在故障检查算法进一步 包括:
避过所述风扇控制器模块,传送全速信号;
确定是否检测到风扇速度增加;
避过所述风扇控制器模块,去除所述全速信号;
确定是否检测到风扇速度降低;以及
如果没有检测到风扇速度增加和风扇速度降低中的至少一种,则 指示所述嵌入式计算机机箱的所述冷却模块中存在潜在故障。
6.如权利要求5所述的方法,其中总线主模块避过所述风扇控制 器模块,应用全速信号将所述风扇速度增加到全速。
7.如权利要求5所述的方法,其中总线主模块避过所述风扇控制 器模块,去除全速信号以降低所述风扇速度。
8.如权利要求1所述的方法,其中检测风扇速度的变化包括风扇 转速计检测所述风扇速度。
9.如权利要求1所述的方法,其中指示潜在故障包括传送警报信 号。
10.一种嵌入式计算机机箱,其包括:
冷却模块,其用于冷却所述嵌入式计算机机箱;
连接到所述冷却模块的总线主模块,其中,在检测到所述冷却模 块中的活跃故障之前,所述总线主模块执行风扇控制器潜在故障检查 算法和全速潜在故障检查算法,所述风扇控制器潜在故障检查算法包 括:
试图经由所述冷却模块中的风扇控制器模块修改所述冷却模块中 的风扇速度;
确定是否检测到所述风扇速度的变化;
所述全速潜在故障检查算法包括:
试图避过所述风扇控制器模块,经由全速风扇控制电路修改所述 风扇速度;
确定是否检测到所述风扇速度的变化;
以及
如果在所述风扇控制器潜在故障检查算法和所述全速潜在故障检 查算法中的至少一个中没有检测到所述风扇速度变化,则指示所述嵌 入式计算机机箱的所述冷却模块中存在潜在故障。
11.如权利要求10所述的嵌入式计算机机箱,所述风扇控制器潜在 故障检查算法进一步包括:
传送增加风扇速度的信号;
确定是否检测到风扇速度增加;
传送降低风扇速度的信号;
确定是否检测到风扇速度降低;以及
如果没有检测到风扇速度增加和风扇速度降低中的至少一种,则 指示所述嵌入式计算机机箱的所述冷却模块中存在潜在故障。
12.如权利要求11所述的嵌入式计算机机箱,其中所述总线主模块 命令所述风扇控制器模块修改所述风扇速度。
13.如权利要求12所述的嵌入式计算机机箱,其中所述总线主模块 经由智能平台管理总线(IPMB)命令所述风扇控制器模块。
14.如权利要求10所述的嵌入式计算机机箱,所述全速潜在故障检 查算法进一步包括:
避过所述风扇控制器模块,传送全速信号;
确定是否检测到风扇速度增加;
避过所述风扇控制器模块,去除所述全速信号;
确定是否检测到风扇速度降低;以及
如果没有检测到风扇速度增加和风扇速度降低中的至少一种,则指 示所述嵌入式计算机机箱的所述冷却模块中存在潜在故障。
15.如权利要求14所述的嵌入式计算机机箱,其中所述总线主模块 避过所述风扇控制器模块,应用全速信号以将所述风扇速度增加到全速。
16.如权利要求14所述的嵌入式计算机机箱,其中所述总线主模块 避过所述风扇控制器模块,去除全速信号以降低所述风扇速度。
17.如权利要求10所述的嵌入式计算机机箱,其中由风扇转速计检 测所述风扇速度的变化。
18.如权利要求10所述的嵌入式计算机机箱,其中当检测到潜在故 障时,传送警报信号。

说明书全文

背景技术

嵌入式计算机机箱系统主要包括连接到底板的各种安装在机架上 的计算机卡。计算机卡可以包括利用总线或底板上的交换式结构拓扑 进行通信的有效载荷(payload)卡和交换模卡。可以选择有效载荷 卡和交换卡,从而为计算机机箱提供用户所期望的功能或特色。

各个嵌入式计算机机箱通常都包括安装在机箱上的冷却模块,用 于冷却计算机卡。计算机设备中的大多数冷却模块都实现了变速扇 控制以及风扇转速计监控,以检测风扇故障或将要发生的风扇故障。 然而,风扇转速计或风扇控制器可能出现故障,导致给出指示风扇正 常的误读。这是一种潜在故障,因为这是一种已经发生了但仍然没有 危害冷却子系统的故障。此外,如果风扇或风扇控制当时也出现故障 了,则潜在故障被激活,风扇转速计提供的读数指示风扇正在正常工 作,而实际上风扇已经出现故障。当前已有的技术没有提供在嵌入式 计算机系统的冷却子系统中检测潜在故障的方法。

因此,需要一种装置和方法对冷却模块进行潜在故障检查,而这 在已有技术中尚未得到满足。于是,急需一种装置克服以上概述的已 有技术的不足。

附图说明

发明的代表性元件、操作特点、应用以及/或者优点可以从此后 更全面地进行描述、描写以及声明的构架和操作细节中得到,对于附 图的引用也形成其中的一部分,其中,自始至终,相同的数字指示相 同的部件。根据详细描述中叙述的某些范例实施例,其它元件、操作 特点、应用以及/或者优点将变得明显,其中:

图1代表性地阐明了根据本发明一种范例实施例的计算机系统;

图2代表性地阐明了根据本发明另一种范例实施例的计算机系统; 以及

图3代表性地阐明了根据本发明一种范例实施例的流程图

仅简要地阐明图表中的元件,因此无需按比例进行绘制。例如, 相对于其它元件,可能夸大了图表中的一些元件的尺寸,以有助于提 高对于本发明各种实施例的理解。此外,此处的“第一”、“第二”等 术语用于区分类似的元件,而不一定是在描述顺序或者时间顺序。而 且,内容说明以及/或者权利要求中的术语“前面”、“背面”、“顶部”、 “底部”、“上”、“下”等通常用于描述性目的,而不一定是为了全面 地描述唯一的相对位置。可以在适当的情况下对这样使用的前述所有 术语进行相互交换,从而在那些已经明确阐述或另外描述的其它构造 和/或定位中也能够操作此处描述的本发明的各种实施例。

具体实施方式

本发明的以下代表性描述主要涉及范例实施例以及发明人对最佳 模式的概念,而不是为了以任何方式限制本发明的应用或构造。更确 切地,以下描述意在为实施本发明的各种实施例提供方便的阐述。将 可以看到,无需脱离本发明的精神和范围,即可以对所公开的范例实 施例中描述的任何元件的功能和/或排列做出改变。
为了解释的简明起见,部分地将本发明的实施例表示为包括单独 的功能块。可以通过使用共享的或者专用的硬件来提供这些功能块所 表示的功能,其中,所述硬件包括但不限于能够执行软件的硬件。本 发明不限于通过任何特定的元件组进行实施,此处的描述仅表示一种 实施例。
将此处使用的术语“一种”定义为一种或超过一种。将此处使用 的术语“多种”定义为两种或超过两种。将此处使用的术语“另一种” 定义为至少第二种或更多。将此处使用的术语“包括”和/或“具有” 定义为包括(即,开放式语言)。将此处使用的术语“连接”定义为连 接,这不必需是直接连接,也不必需是机械式连接。将此处使用的术 语“程序”、“软件应用程序”定义为被设计好以在计算机系统上执行 的指令序列。程序、计算机程序,或者软件应用程序可以包括子程序、 函数、过程、对象方法、对象实施、可执行应用程序、applet、servlet、 目标码、共享库/动态加载库以及/或者其它的被设计好以在计算机系统 上执行的指令序列。一个组件可以包括计算机程序、软件应用程序, 或者一行或多行计算机可读的执行指令。
执行本发明实施例的软件块可以是计算机程序模块的一部分,该 计算机程序模块包括计算机指令以及存储在诸如存储器等计算机可读 介质中的这些控制算法。计算机指令能够指示处理器执行以下所述的 任何方法。在其它实施例中,如果需要,可以提供另外的模块。
提供一种范例实施例的详细描述,作为具体的使能公开说明,根 据本发明的各种实施例,可以将其推广为对冷却模块进行潜在故障检 查的公开系统、设备以及方法的任何应用。
图1代表性地阐明了根据本发明一种范例实施例的计算机系统 100。计算机系统100可以包括具有前侧102和后侧104的嵌入式计算 机机箱。在一种实施例,计算机系统100和嵌入式计算机机箱101可 以遵从PICMG 3.0高级TCA规范中定义的高级通信(Advanced Telecom)和计算架构(ATCATM)标准。在另一种实施例中,计算机 系统100和嵌入式计算机机箱101可以遵从CompactPCI标准。在另一 种实施例中,嵌入式计算机机箱101可以遵从 MicroTCA草案 0.6—微通信计算架构基础规范(以及后续版本)中定义的MicroTCA 标准。本发明的实施例不限于遵从所有这些标准的计算机系统,遵从 其它标准的计算机系统也在本发明的范围之内。
嵌入式计算机机箱101可以包括多个插槽,用于插入例如有效载 荷模块以及交换模块的计算模块118。可以将计算模块118连接到底板 (为简洁起见,未示出)以促进功率分配,以及/或者利用总线拓扑、 交换结构拓扑等进行通信。在一种实施例中,底板可以包括,例如, 100欧姆差分信号对,但不限于此。当在操作中,计算模块118产生热 量,必须从嵌入式计算机机箱101中去除该热量。
计算模块118可以包括至少一个交换模块,经由底板将交换模块 连接到任意数量的有效载荷模块,其中,底板可以容纳包括分布式交 换结构的分组交换底板或者多点总线类型底板的任意组合。底板架构 可以包括CompactPCI、高级通信计算架构(AdvancedTCA)、MicroTCA 等。
有效载荷模块可以通过加入处理器、存储器、存储装置、I/O元件 等为计算机系统100增加功能。换言之,有效载荷模块可以包括处理 器、存储器、存储装置、I/O元件等的任意组合,从而为计算机系统100 增加用户所期望的任何功能。
在一种实施例中,计算机系统100可以使用交换模块作为中心交 换式集线器,其中,任意数量的有效载荷模块连接到一个或多个交换 模块。计算机系统100可以支持点到点、交换式输入/输出(I/O)结构。 可以利用一种或多种交换式结构网络标准实现计算机系统100,例如, 交换式结构网络标准可以是InfiniBandTM、串行RapidIOTM、EthernetTM、 AdvancedTCATM、PCI ExpressTM、千兆以太网等,但不限于这些。计 算机系统100不限于使用所述这些交换式结构网络标准,使用其它交 换式结构网络标准也在本发明范围之内。
在一种实施例中,嵌入式计算机机箱101可以包括冷却子系统, 以及检测和反应嵌入式计算机机箱中温度变化的温度传感器和其它硬 件和软件模块,其中,所述冷却子系统包括任意数量的冷却模块108, 以散发计算模块118产生的热量。在一种特定的实施例中,并且不限 于本发明,可以将冷却模块108安放在计算模块118附近。嵌入式计 算机机箱101可以包括多个风扇模块槽106,每个槽都用来放置冷却模 块108,以经由嵌入式计算机机箱101抽取冷空气120。在一种实施例 中,每个冷却模块108可以包括一个或多个风扇或吹风机、功率和控 制电路等(以下进行更全面的讨论)。可以将冷却模块108插入各个风 扇模块槽106,并从嵌入式计算机机箱的中心或专用电源接收功率。在 一种实施例中,嵌入式计算机机箱101可以包括冷却模块盖110,从而 在维护以及系统诊断时为冷却模块提供访问入口。在以下对实施例的 讨论中,可以将术语“风扇”理解为包括“吹风机”、“风扇”,或者“吹 风机”和“风扇”的任意组合。
图2代表性地阐明了根据本发明另一种范例实施例的计算机系统 200。在一种实施例中,计算机系统200可以包括连接到至少一个总线 主模块230的冷却模块208。冷却模块208可以是模块化的冷却风扇盘, 其连接以插入风扇模块槽106,并且包括一个或多个风扇236,以及风 扇控制器模块232,其连接以向风扇发出例如增加速度、降低速度、开 /关信号等命令。冷却模块208还可以包括风扇转速计234,其连接以 读取以rpm计数的风扇速度等,并向风扇控制器模块232报告风扇速 度239,然后,风扇控制器模块232向总线主模块230报告风扇速度 239。
连接到冷却模块208的是总线主模块230,其具有控制维护总线 231的功能。在一种实施例中,维护总线231可以在总线主模块230 和冷却模块208之间传送管理数据。管理数据可以包括,例如,与温 度、电压、安培数、总线通信量、状态指示等相关的数据,并且不限 于此。管理数据还可以包括指令,例如,用于冷却风扇、调整电源等 的指令,并且不限于此。经维护总线231传送的管理数据具有监控以 及维护冷却模块208的功能。管理数据与数据总线(为简明起见,未 示出)上发送的其它数据的不同之处在于管理数据用于监控以及维护 冷却模块208,而不是其它事情,而另外的数据总线具有传送数据的功 能,将所述数据发送给计算模块118以进行处理,或从其接收已经经 过处理的数据。
在一种实施例中,维护总线231可以是智能平台管理接口规范中 规范的智能平台管理总线(IPMB)。该智能平台管理总线可以是基于 I2C的总线,其在机箱中的不同板块之间提供标准化的相互连接。所述 IPMB还可以作为辅助或紧急管理插入卡的标准化接口。在一种实施例 中,总线主模块230可以是AdvancedTCA计算机平台中所公知的机架 管理控制器(ShMC)。
在正常操作下,风扇控制器模块232基于嵌入式计算机机箱101 的冷却需要控制风扇速度239。例如,如果总线主模块230检测到嵌入 式计算机机箱101中温度升高,则其用信号通知冷却模块208,具体地 通知风扇控制器模块232其需要提高风扇速度239,以增加冷空气气 流。如果系统正确工作,则风扇控制器模块232可以向风扇236发出 提高风扇速度239的命令。风扇控制器模块232经由风扇转速计234 检测到此风扇速度提高,其中,转速计234测量风扇236的rpm,并经 由维护总线231上的风扇控制器模块向总线主模块230报告风扇236 的rpm。如果总线主模块230检测到嵌入式计算机机箱101的温度过低, 则将此相同的过程反过来操作。这种情况下,利用经由风扇转速计234 的风扇速度的对应反馈命令降低风扇速度。
由于冷却模块208对于计算机系统200的可靠操作很关键,因此 冷却模块208还包含了全速风扇控制电路238,从而总线主模块230 无需通过维护总线231以及风扇控制器模块232即可命令风扇236增 加速度到全速。例如,如果需要增加冷空气,总线主模块230命令提 高风扇速度239,并且没有经由上述的反馈机制给出所增加的风扇速度 的指示,则总线主模块230有另外的通道来命令提高风扇速度239。这 样可以指示风扇控制器模块232的故障。这种情况下,总线主模块230 可以通过发出全速信号246直接命令风扇236提高到全速,从而使得 风扇236提高到全速以提供最大的冷却效果。此特点为冷却模块208 增加了额外的容错层,从而增加了可靠性。
除了以上特点,当前的已有技术没有提供检测冷却模块208中的 潜在故障的方法或装置。潜在故障是已经发生但却没有被发现或者没 有表现其自身的故障。这与已经被发现或者已经表现其自身的活跃故 障形成对比。在已有技术中,如果风扇转速计234或者风扇控制器模 块232发生故障,导致不管风扇速度239或者风扇236的实际情况怎 样(电压或电流等),其都显示风扇速度239为足够,总线主模块230 将得不到存在问题的指示。将这种被称为潜在故障,因为它是冷却模 块208的故障,但是却不会触发故障指示,直到出现第二个故障(例 如,嵌入式计算机机箱101的不充足冷却)。
换言之,潜在故障是当前的故障,但其不可见或不活跃。为了维 持高可靠性、高可用性的系统,需要在出现第二个故障并且其将所述 潜在故障激发为活跃故障状态之前就检测到冷却模块208中的潜在故 障。这将是风扇控制器潜在故障检查算法242以及全速潜在故障检查 算法240的功能,这些算法可以是用来在潜在故障将其自身展现为活 跃故障之前就检测到冷却模块208中的潜在故障的任何软件或硬件的 组合。
风扇控制器潜在故障检查算法242具有在冷却模块208中的故障 活跃之前测试风扇控制器模块232、全速风扇控制电路238以及风扇转 速计234的功能。在冷却模块208中的故障活跃之前,或者在检测到 冷却模块208中的活跃故障之前,可以周期性地使用风扇控制器潜在 故障检查算法242来增加冷却模块208和冷却子系统的可靠性。
风扇控制器潜在故障检查算法242试图经由风扇控制器模块232 修改风扇速度239,并在总线主模块230处检测风扇速度245的变化, 以确定风扇控制器模块232以及风扇转速计234是否在正常工作。例 如,可以经由风扇控制器模块232从总线主模块230发送增加风扇速 度的信号243,以增加风扇速度239。经由风扇转速计234的测量确定 是否检测到风扇速度增加241。并且,可以经由风扇控制器模块232 从总线主模块230发送降低风扇速度的信号244,以降低风扇速度239。 经由风扇转速计234的测量确定是否检测到风扇速度降低242。如果没 有检测到风扇速度增加241或者没有检测到风扇速度降低242,则指示 冷却模块208中可能存在潜在故障。在一种实施例中,可以产生警报 信号250通知系统管理者所述潜在故障。
为了进一步测试冷却模块208中的潜在故障,可以采用全速潜在 故障检查算法240。全速潜在故障检查算法240试图避过风扇控制器模 块232经由全速风扇控制电路238修改风扇速度239,并在总线主模块 230处检测风扇速度245的变化,以确定全速风扇控制电路238、风扇 控制器模块232以及风扇转速计234是否在正常工作。例如,可以避 过风扇控制器模块232经由全速风扇控制电路238向风扇236发送全 速信号246。经由风扇转速计234的测量确定是否检测到风扇速度增加 241。避过风扇控制器模块232去除全速信号246能使得风扇速度239 降低,例如,回到实施上述算法之前的风扇速度。经由风扇转速计234 的测量确定是否检测到风扇速度降低242。如果没有检测到风扇速度增 加241或者没有检测到风扇速度降低242,则指示冷却模块208中可能 存在潜在故障。在一种实施例中,可以产生警报信号250通知系统管 理者所述潜在故障。
可以以任何顺序进行以上算法,其均在本发明的范围之内。此外, 在两种算法中可以以任何顺序进行增加以及降低风扇速度的测试,这 均在本发明的范围之内。
图3代表性地阐明了根据本发明一种范例实施例的流程图300。在 步骤302中,经由风扇控制器模块传送增加风扇速度的信号。在步骤 304中,确定是否已经增加了风扇速度。如果没有,每次在步骤318 时指示潜在故障。如果已经增加了风扇速度,在步骤306中经由风扇 控制器模块传送降低风扇速度的信号。在步骤308中确定是否已经降 低了风扇速度。如果没有,则每次在步骤318时指示潜在故障。
如果在步骤308中已经降低了风扇速度,则每次在步骤310中避 过风扇控制器模块传送全速信号。在步骤312中确定是否已经增加了 风扇速度。如果没有,则每次在步骤318时指示潜在故障。如果已经 增加了风扇速度,则每次在步骤314中避过风扇控制器模块去除全速 信号。在步骤316中确定是否已经降低了风扇速度。如果没有,则每 次在步骤318时指示潜在故障。如果每次在步骤316中已经降低了风 扇速度,则每次在步骤322中没有检测到潜在故障。如果在所述流程 图中的任何点处,每次在步骤318中检测到潜在故障,则每次在步骤 320中生成警报信号,通知系统管理员所述潜在故障。
在前述规范中,已经参考具体范例实施例描述了本发明。然而, 可以理解,无需脱离在以下权利要求中阐明的本发明的范围,即可得 到各种修改和变化。应认为所述规范和图表仅起到说明作用,而不是 限制性的,所有这些修改都被认为包含在本发明的范围之内。于是, 本发明的范围应该由此处附加的权利要求等进行确定,而不仅仅由上 述范例确定。
例如,可以以任意顺序执行任何方法或处理的权利要求中叙述的 步骤,而不限于此权利要求中展示的具体顺序。此外,可以以各种排 列组合或可操作地配置任何装置的权利要求中叙述的组件和/或元件, 从而实质上产生和本发明相同的结果,并且,这相应地不限于所述权 利要求中叙述的具体构造。
已经针对具体实施例描述了本发明的益处、其它优点以及问题的 解决方案;然而,不能将任何益处、优点、问题的解决方案或者能够 使得任何特殊的益处、优点或者解决方案出现或者变得更加显著的任 何元素理解为任何或者所有权利要求的关键的、必须的或者本质的特 征或组件。
除了那些没有特别叙述的之外,无需脱离相同的一般原理,可以 改变本发明的实践中使用的上述结构、安排、应用、比例、元件、材 料或者组件的其它组合和/或修改,或者对它们进行特殊调整,以适应 具体的环境、制造规范、设计参数或者其它使用要求。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈