首页 / 专利库 / 电脑零配件 / 多核处理器 / 一种多处理器计算机的故障检测和健康管理方法

一种多处理器计算机的故障检测和健康管理方法

阅读:807发布:2020-05-11

专利汇可以提供一种多处理器计算机的故障检测和健康管理方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种面向弹载惯性 导航系统 、基于多核DSP的核心计算平台故障检测和健康管理方法,通过 多核处理器 心跳监测,多核心跳监测,多电源供电监测, 大气压 力 和环境 温度 监测以及高速1553B总线监测等方法,通过 数据采集 与传输、数据预处理、特征提取、状态监测和健康管理的流程,实现了面向弹载导航系统的核心计算平台的故障检测与健康管理。,下面是一种多处理器计算机的故障检测和健康管理方法专利的具体信息内容。

1.一种多处理器计算机的故障检测和健康管理方法,基于一种由数据采集部分、数据处理部分、状态监测与故障诊断部分构成的核心计算平台,其中数据采集部分包括多种传感器、处理器监测模、总线接口模块,其特征在于所述故障检测和健康管理方法具体包括:
(1)通过设计多核心跳电路实现多核DSP核心电路故障检测;
(2)二次电源网络的故障监测和预测;
(3)恶劣环境参数传感器的采集和监控;
(4)高速1553B总线通信监测。
2.如权利要求1所述的一种多处理器计算机的故障检测和健康管理方法,其特征在于:
所述多核DSP是采用DSP-Q6713J/500芯片。
3.权利要求1或2所述的一种多处理器计算机的故障检测和健康管理方法,其特征在于:所述步骤(1),DSP-Q6713J/500芯片包含4个独立的EMIF总线,通过EMIF总线利用FPGA资源扩展出心跳寄存器,每个独立的内核在系统上电运行后对心跳寄存器进行维护,并将维护结果存储在对应的计算单元,由主控单元对各核的心跳进行检测,当其他单元的心跳出现异常时,将对应的故障代码通过总线发送给系统控制单元,从而实现多核处理器功能电路的故障监测。
4.如权利要求1所述的一种多处理器计算机的故障检测和健康管理方法,其特征在于:
所述步骤(2),是用于实现复杂二次电源网络的定量测试,并通过数据采集和数据分析判断二次电源工作的状态趋势,从而为二次电源健康进行估计。
5.如权利要求1或4所述的一种多处理器计算机的故障检测和健康管理方法,其特征在于:所述步骤(2)具体为,对电压范围内全边缘扫描测试,在输出网络中设计电压调理和交叉开关,再通过高速的A/D采样获得二次电源的幅值状态,通过统计量值,观察二次电源输出的变化情况,由于二次电源的性能退化直至失效一般是渐变性的,通过长时间的数据采样和分析,对二次电源输出电压进行监控。
6.如权利要求1所述的一种多处理器计算机的故障检测和健康管理方法,其特征在于:
所述步骤(3)是采用高精度的传感器将系统所在的环境参数进行采集,通过环境传感器采集、滤波和估计,从而判断系统运行工作环境的可靠性。
7.如权利要求1所述的一种多处理器计算机的故障检测和健康管理方法,其特征在于:
所述步骤(4)中,高速1553B总线的检测是采用离线模式进行通讯检测。
8.如权利要求7所述的一种多处理器计算机的故障检测和健康管理方法,其特征在于:
所述采用离线模式进行通讯检测的具体方法为,在系统中作为RT,控制和测试指令均由系统的BC发出,在高速1553B总线的上电BIT中,对1553B总线的A、B通道分别进行对应的矢量字命令测试和数据测试,A、B总线通道切换测试均通过后,系统上电BIT测试才算通过,保证冗余的两个通道在上电BIT中均被覆盖测试。

说明书全文

一种多处理器计算机的故障检测和健康管理方法

技术领域

[0001] 本发明属于嵌入式系统技术领域,具体涉及一种多处理器计算机的故障检测和健康管理方法。

背景技术

[0002] 弹载惯性导航系统存在安装方式可拆卸性差,使用环境为周期性的暴露在极端温度和湿度条件下,寿命周期内任务次数较少,存放期长等特点,因此弹载惯性导航系统中的核心计算平台受限于以上使用条件,需要具有较强的故障检测和健康管理能,同时故障检测机制需要具备误报率低和故障检测率高,以及故障隔离的能力。
[0003] 欧美各国的故障检测和健康管理技术应用范围覆盖各类先进武器装备,而且数量众多。在PHM技术的实施效果方面,F-35飞机最为显著,采用PHM技术后飞机的故障不可复现率减少82%,维修人力减少20%~40%,后勤规模减小50%,出动架次率提高25%,飞机的使用与保障费用比过去的机种减少了50%以上,而使用寿命达8000飞行小时。统计数据充分证明了PHM在降低维修保障成本,提高武器装备安全性、可用度与完好性,确保任务成功性,提升作战效能方面的重要作用。
[0004] 北京自动化控制设备研究所申请专利《一种基于多核DSP的惯性/卫星深组合信息处理硬件平台》,解决了惯性/卫星深组合导航信息处理算法对于数据共享、时钟同步、运算实时性和运算能力的要求的技术问题。该发明中仅提到了硬件资源的实现机理,但未考虑到硬件系统中故障检测和健康管理的方法。
[0005] 华中光电技术研究所申请的《一种基于异构多核架构的导航解算装置》解决了多核系统中各个基本处理单元之间的高速数据交换机制和消息同步机制,硬件结构可扩展、可裁剪,能适应多种不同的导航需求和处理方法,具有较好的实时性,灵活性和可靠性。但未涉及导航解算装置中的多核处理器核心及外围电路的故障检测及健康管理相关的描述。

发明内容

[0006] 本发明的目的在于提供一种多处理器计算机的故障检测和健康管理方法,该方法是面向机弹载环境应用中基于多核DSP的核心计算平台中的故障检测及健康管理,针对多核处理,温度、气压采集和高速串行总线等功能部件的故障检测机制,用于满足嵌入式环境核心处理平台的自主故障检测和健康管理的需求。
[0007] 本发明是采用如下技术方案实现:
[0008] 一种多处理器计算机的故障检测和健康管理方法,基于一种由数据采集部分、数据处理部分、状态监测与故障诊断部分构成的核心计算平台,其中数据采集部分包括多种传感器、处理器监测模、总线接口模块,所述故障检测和健康管理方法具体包括:
[0009] (1)通过设计多核心跳电路实现多核DSP核心电路故障检测;
[0010] (2)二次电源网络的故障监测和预测;
[0011] (3)恶劣环境参数传感器的采集和监控;
[0012] (4)高速(4M)1553B总线通信监测。
[0013] 优选地,所述多核DSP是采用DSP-Q6713J/500芯片。
[0014] 优选地,所述步骤(1),DSP-Q6713J/500包含4个独立的EMIF总线,通过EMIF总线利用FPGA资源扩展出心跳寄存器,每个独立的内核在系统上电运行后对心跳寄存器进行维护,并将维护结果存储在对应的计算单元,由主控单元对各核的心跳进行检测,当其他单元的心跳出现异常时,将对应的故障代码通过总线发送给系统控制单元,从而实现多核处理器功能电路的故障监测。
[0015] 优选地,所述步骤(2),是用于实现复杂二次电源网络的定量测试,并通过数据采集和数据分析判断二次电源工作的状态趋势,从而为二次电源健康进行估计。
[0016] 优选地,所述步骤(2)具体为,对电压范围内全边缘扫描测试,在输出网络中设计电压调理和交叉开关,再通过高速的A/D采样获得二次电源的幅值状态,通过统计量值,观察二次电源输出的变化情况,由于二次电源的性能退化直至失效一般是渐变性的,通过长时间的数据采样和分析,对二次电源输出电压进行监控。
[0017] 优选地,所述步骤(3)是采用高精度的传感器将系统所在的环境参数进行采集,通过环境传感器采集、滤波和估计,从而判断系统运行工作环境的可靠性。
[0018] 优选地,所述步骤(4)中,高速1553B总线的检测是采用离线模式进行通讯检测。
[0019] 优选地,所述采用离线模式进行通讯检测的具体方法为,在系统中作为RT,控制和测试指令均由系统的BC发出,在高速1553B总线的上电BIT中,对1553B总线的A、B通道分别进行对应的矢量字命令测试和数据测试,A、B总线通道切换测试均通过后,系统上电BIT测试才算通过,保证冗余的两个通道在上电BIT中均被覆盖测试。
[0020] 本发明具有的技术效果:本发明解决了导航核心资源的板内资源故障检测和健康管理,为使用在恶劣环境下的嵌入式设备实现了故障预测机制,提高系统的可靠性。附图说明
[0021] 图1为核心计算平台故障监测与健康管理数据流示意图。
[0022] 图2为核心计算平台接口及功能图。
[0023] 图3为核心计算平台二次电源供电网络。
[0024] 图4为铂电阻测温RTD电路原理示意图。
[0025] 图5为气压采集原理示意图。
[0026] 图6为高速1553B总线接口电路。

具体实施方式

[0027] 下面结合附图对本发明做进一步的描述。参照附图1-6,对本发明实现的具体步骤做进一步的描述。本发明所述的一种多处理器计算机的故障检测和健康管理方法已经在某导航系统中成功实施。
[0028] 一种多处理器计算机的故障检测和健康管理方法,基于一种由数据采集部分、数据处理部分、状态监测与故障诊断部分构成的核心计算平台,核心计算平台的架构如图1所示,其中数据采集部分包括多种传感器、处理器监测模块、总线接口模块,所述故障检测和健康管理方法具体包括:
[0029] (1)通过设计多核心跳电路实现多核DSP核心电路故障检测;
[0030] (2)二次电源网络的故障监测和预测;
[0031] (3)恶劣环境参数传感器的采集和监控;
[0032] (4)高速(4M)1553B总线通信监测。
[0033] 多核DSP选用的是国防科大研制的的多核DSP-Q6713J/500芯片,选用SMQ2V1000为可编程逻辑芯片。其中,处理器分别包含4个基于C6713的内核,最高工作主频可到500MHz。
[0034] 在系统中四个内核分别实现以下工作:
[0035] 第一个内核实现对1553B总线,高、低速串型总线管理,内外频标的切换;
[0036] 第二个内核实现对电机的控制和紧机构的采集;
[0037] 第三个内核实现用户的自标定功能;
[0038] 第四个内核用于健康管理与故障诊断决策和判断。
[0039] 在步骤(1)中DSP-Q6713J/500包含4个独立的EMIF总线,通过EMIF总线利用FPGA资源扩展出心跳寄存器,每个独立的内核在系统上电运行后对心跳寄存器进行维护,并将维护结果存储在对应的计算单元,由主控单元对各核的心跳进行检测,当其他单元的心跳出现异常时,将对应的故障代码通过总线发送给系统控制单元,从而实现多核处理器功能电路的故障监测,如图2所示。同时寄存器通过离散量的形式与外部测试接口互联,4路DSP离散输出信号,均进行光耦隔离。信号隔离设计采用HCPL-6651或HCPL-0631。通过外部测试也可获得多核处理器的工作健康状态
[0040] 在步骤(2)中,核心计算平台承担各类接口、总线以及电机伺服电路等众多功能,如图2所示,二次电源网络也较为复杂,二次电源中任何一个电源出现故障都可能波及到系统的正常运行,因此对二次电源网路的监测是关系到系统健康运行的关键点。
[0041] 电源监测是对二次电源的输出进行定量测试,对电压范围内全边缘扫描测试,在输出网络中设计电压调理和交叉开关,再通过高速的A/D采样获得二次电源的幅值状态。通过统计量值,观察二次电源输出的变化情况,由于二次电源的性能退化直至失效一般是渐变性的,通过长时间的数据采样和分析,对二次电源输出电压进行监控,从而对电源失效的情况进行预警。
[0042] 步骤(3)中的温度及气压采集电路为不仅为系统提供功能部件的补偿参数,而且监控传感器本体是否工作在预期的工作环境中,当环境温度和气压较为恶劣时,传感器的采集精度会大幅下降,因此对传感器工作的温度环境和气压环境要进行监测,当环境恶劣时,及时上报给系统。
[0043] 核心计算平台采用铂电阻传感器进行温度采集,如图4所示,温度采集电路设计基于高精度测温专用AD芯片ADS1148。TI公司的ADS1148是高度集成的16位精密ADC芯片,ADS1148内部有两个完全相同的恒流源IDAC,避免引入测量误差。ADS1148模数转换芯片属于测温专用数据采集器,一片ADS1148可以外接4路差分形式输入的模拟信号,有2个相同恒流源IDAC,ADS1148与DSP之间采用SPI总线进行通信,ADS1148是高度集成的16位精密ADC芯片。采用三线制RTD(铂电阻)的接法采用一种比率结构产生参考电压,提高了系统的精度。同时针对温度传感器非线性的特性,采用最小二乘多项式拟合、二分法查表的方法对温度测量的非线性误差进行了校正与补偿,进一步提高了系统温度测量的精度。
[0044] 大气压力的模拟信号接口电气特性暂定为0-5V,考虑芯片、接口、逻辑的一致性,大气压、电压采集也采用铂电阻测温电路采集用的ADC芯片,前端进行运放FX147调理后,输入ADS1148,电路原理见图5。
[0045] 步骤(4)中,高速1553B总线为系统的通讯总线,高速1553B总线接口电路如图6所示,系统的所有命令均通过1553B总线进行下发。总线运行的可靠性直接关系到核心处理平台与系统交互的可靠性。
[0046] 核心处理平台中的高速1553B总线的检测采用离线模式进行通讯检测,即对高速总线进行离线A/B通道进行分别的指令发送和应答检测,通过固定通道的指令发送和固定通道的指令回传,对冗余的A/B通道进行物理链路层的检测,确保总线链路的可靠性。在系统中作为RT,控制和测试指令均由系统的BC发出。在高速1553B总线的上电BIT中,对1553B总线的A、B通道分别进行对应的矢量字命令测试和数据测试,A、B总线通道切换测试均通过后,系统上电BIT测试才算通过,保证冗余的两个通道在上电BIT中均被覆盖测试。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈