首页 / 专利库 / 人工智能 / 嵌入式计算 / 一种基于动态多层耦合网络的复杂系统故障定位方法

一种基于动态多层耦合网络的复杂系统故障定位方法

阅读:1027发布:2020-06-16

专利汇可以提供一种基于动态多层耦合网络的复杂系统故障定位方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种基于动态多层耦合网络的复杂系统故障 定位 方法,步骤有:步骤A:构建多模式下的动态多层耦合网络;步骤B:定位复杂系统故障时段;步骤C:定位复杂系统故障 节点 。本发明针对传统可靠性分析手段常应用于单故障源头、静态分析的场景,在难以对具有动态传播、级联失效、多元故障、不确定性等特点的复杂系统实现故障定位的难点,运用复杂网络理论提出了一种基于动态多层耦合网络的复杂系统故障定位方法,该方法无需计算对比所有节点特征信息,可较少占用计算机算 力 的前提下快速地定位复杂系统的故障节点,具有良好的实际应用价值。,下面是一种基于动态多层耦合网络的复杂系统故障定位方法专利的具体信息内容。

1.一种基于动态多层耦合网络的复杂系统故障定位方法,其特征在于:其步骤如下:
步骤A:构建多模式下的动态多层耦合网络;
步骤B:定位复杂系统故障时段;
步骤C:定位复杂系统故障节点
2.根据权利要求1所述的一种基于动态多层耦合网络的复杂系统故障定位方法,其特征在于:
其中,步骤A中所述的“动态多层耦合网络”,其具体含义为:能抽象反映复杂系统内部动态运行状态的动态网络模型,动态网络模型为一组基于时间切片的静态网络,由于复杂系统常具有复数个层次且各层之间除了同层交互还有跨层耦合,如嵌入式系统软件层与硬件层存在模的映射关系,故为了更真实描述系统状态,动态网络模型为包含复数层节点、同层连边以及耦合连边的复数层耦合网络;在步骤A中所述的“构建多模式下的动态多层耦合网络”,包括以下步骤:
步骤A1:量化复杂系统的正常模式与故障模式;
步骤A2:构建正常模式的动态复数层耦合网络;
步骤A3:构建故障模式的动态复数层耦合网络;
其中,在步骤A1中所述的“正常模式”,其具体含义为:复杂系统在执行一故障激发测试用例后,复杂系统处于正常运行的表现形式;
其中,在步骤A1中所述的“故障模式”,其具体含义为:复杂系统在执行一故障激发测试用例后,复杂系统处于故障运行的表现形式;
其中,在步骤A1中所述的“量化复杂系统的正常模式与故障模式”,其具体做法如下:量化复杂系统状态监控工具对于正常模式与故障模式相对应的性能指标,即规范不同故障现象对应的监测指标,以及系统正常运行时的监测指标;以嵌入式系统这类典型的软硬件综合系统为例,对于操作系统执行一操作后,反应延迟超过10s,认定系统发生阻塞故障;
其中,在步骤A2中所述的“构建正常模式的动态复数层耦合网络”,其具体做法如下:根据复杂系统的特性,选择合适的动态运行数据采样工具,执行一故障激发测试用例,在线采集在该故障激发测试用例下正常运行时的系统动态运行数据,然后基于复杂网络理论,抽取运行数据内部的节点交互关系,离线构建能映射复杂系统正常模式运行机理的动态复数层耦合网络;
其中,在步骤A3中所述的“构建故障模式的动态复数层耦合网络”,其具体做法如下:根据复杂系统的特性,选择合适的动态运行数据采样工具,执行一故障激发测试用例,在线采集在该故障激发测试用例下故障运行时的系统动态运行数据,然后基于复杂网络理论,抽取运行数据内部的节点交互关系,离线构建能映射复杂系统正常模式运行机理的动态复数层耦合网络;
其中,在步骤A2和步骤A3中所述的“动态多层耦合网络”,其具体含义为:一组以时间为序的静态复数层耦合网络的集合,每个静态复数层耦合网络对应着一个动态运行数据的时间切片,设经过分割后的动态运行数据共有m片,则动态复数层耦合网络中应包含m组静态复数层耦合网络;由于节点间调用关系特别是耦合层的节点间调用关系存在方向性,故动态耦合网络的连边为有向连边,动态耦合网络为有向网络。
3.根据权利要求1所述的一种基于动态多层耦合网络的复杂系统故障定位方法,其特征在于:
其中,步骤B中所述的“定位复杂系统故障时段”,其具体含义为:通过对比步骤A构建的正常模式与故障模式下的动态复数层耦合网络统计特征,发现故障发生的时段,并分别提取故障时段下故障模式与正常模式的动态复数层耦合网络切片,为后续的步骤C的定位复杂系统故障节点提供支撑;包括以下步骤:
步骤B1:校准不同模式下的动态复数层耦合网络;
步骤B2:计算不同模式下网络统计特征;
步骤B3:量化故障指标;
步骤B4:提取故障发生时段的动态多层耦合网络切片;
其中,在步骤B1中所述的“校准不同模式下的动态复数层耦合网络”,其具体做法如下:
以执行的一故障激发测试用例为准,设一故障激发测试用例的开始执行的时刻为0时刻,校准不同模式下的动态复数层耦合网络时间,并将执行一故障激发测试用例之前以及结束后的动态复数层耦合网络数据剔除,仅保留与执行故障激发测试用例相关的动态复数层耦合网络;
其中,在步骤B2中所述的“网络统计特征”,其具体含义为:一组能体现动态复数层耦合网络不同时间间隔下的网络整体性质的统计指标,常见的指标有:网络规模、平均度和平均距离;网络规模是在一时间间隔Tk下该网络中活跃的节点总数,能衡量该时刻下复杂系统的工作强度;平均度是平均一时间间隔Tk下该网络内部所有节点的度,平均度能衡量该时间间隔下复杂系统内部总体的连通程度的指标;平均距离是平均一时间间隔Tk下该网络内部任意两节点之间的距离均值,平均距离能衡量该时间间隔下复杂系统内部的信息及物质的传递效率;网络统计特征不局限于以上所举3例,因属于公知部分,不做赘述;
其中,在步骤B2中所述的“计算不同模式下网络统计特征”,其具体做法如下:分别计算在正常模式与故障模式下动态复数层耦合网络中各个时间间隔下静态复数层耦合网络的网络规模、平均度和平均距离统计特征及各类组合,并依时间序列保存计算结果;
其中,在步骤B3中所述的“量化故障指标”,其具体做法如下:量化统计特征异常的标准,设时间间隔Tk下正常模式的一个统计特征的值为Pr,同一时间间隔下故障模式相同的统计特征的值为Pf,设故障指标 当α1≥k1,即故障指标不小于一个设定的常数阈值时,认定在此时间间隔内发生故障,由于在故障模式下复杂系统并不是全时段都处于故障状态,且复杂系统具有故障发生后自我修复的特性,因此故障发生时段的总时长应不大于故障激发测试用例的总时长;
其中,在步骤B4中所述的“提取故障发生时段的动态多层耦合网络切片”,其具体做法如下:依次对比正常模式与故障模式在各个时间间隔下动态复数层耦合网络切片的统计特征组合,计算各个时间间隔下的故障指标,寻找故障模式相对于正常模式统计特征异常时间片段,并提取统计特征异常时间片段下的动态复数层耦合网络切片,为后续的步骤C复杂系统故障细定位提供数据支撑。
4.根据权利要求1所述的一种基于动态多层耦合网络的复杂系统故障定位方法,其特征在于:
其中,步骤C中所述的“定位复杂系统故障节点”,其具体含义为:通过对步骤B4保存的故障发生时段动态复数层耦合网络切片进行分析,找到故障发生的节点,实现复杂系统故障的精细定位,便于系统设计人员完善系统结构,提升复杂系统可靠性;包括以下步骤:
步骤C1:计算故障发生时段节点统计特征;
步骤C2:量化故障指标;
步骤C3:提取故障节点,输出故障信息;
步骤C4:仿真验证;
其中,在步骤C1中所述的“节点统计特征”,其具体含义为:一组能体现动态复数层耦合网络在故障发生时段下的每个节点特征的统计指标,常见的指标有:度和介数;网络节点的度是一个能有效反应一节点与网络中其他节点直接的调用交互状态的指标,其定义为在一时间间隔Tk下一节点vi与其他节点直接相连的节点总数,对于有向网络,分为出度与入度;
网络节点的介数是一个能反映一节点在整体网络中影响与重要程度的指标,其定义某时间间隔Tk下的网络中所有最短路径中经过某节点vi的数目占最短路径总数的比例;
其中,在步骤C1中所述的“计算故障发生时段节点统计特征”,其具体做法如下:依次计算在故障发生时段的故障模式和正常模式动态复数层耦合网络切片的度、介数节点统计特征组合,并保存每个动态复数层耦合网络切片的指标分布;
其中,在步骤C2中所述的“量化故障指标”,其具体做法如下:量化统计特征异常的标准,设时间间隔Tk下的切片中,一节点vi在正常模式的一个统计特征的值为 同一时间间隔下故障模式相同的统计特征的值为 设故障指标 当α2≥k2,即故障指标不小于一个设定的常数阈值时,认定在此时间间隔内该节点发生异常;
其中,在步骤C3中所述的“提取故障节点,输出故障信息”,其具体做法如下:依次计算每个节点故障发生时段下所有动态耦合网络切片中的故障指标,并提取各个动态耦合网络切片中超出设定阈值的节点,被提取的节点集合即为故障节点,统计故障节点出现频次诸故障报告;
其中,在步骤C4中所述的“仿真验证”,其具体做法如下:输入步骤C3提取的故障节点到该复杂系统动态复数层耦合网络模型中,以故障频次为序,基于渗流理论针对该网络模型实施蓄意攻击,观察网络模型受到攻击后的故障效果是否与实际状态拟合,并依据仿真结果输出故障险评估,便于系统设计人员优化系统薄弱节点。

说明书全文

一种基于动态多层耦合网络的复杂系统故障定位方法

技术领域

[0001] 本发明提出了一种基于动态多层耦合网络的复杂系统故障定位方法,它涉及一种基于动态多层耦合网络的复杂系统故障定位方法,属于复杂性科学领域和可靠性技术领域。

背景技术

[0002] 21世纪以来,以互联网为首的信息科学的进步在带动了世界工业与经济平的快速发展的同时也给系统科学与系统工程带来了冲击。传统的简单系统无法解决日益多元化的应用需求,嵌入式技术、物联网人工智能等新兴技术在大幅度提升系统性能的同时使得系统结构变得越来越复杂。以信息物理系统为例,其系统内部结构的信息层、物理层、网络层、决策层存在多层次非线性耦合关系,系统内部动态运行时存在功能涌现。当复杂系统发生失效时,其日益复杂的拓扑结构与非线性耦合的动学特性使得故障具有动态传播、级联失效、多元故障等特点,如软硬件综合系统其失效模式常常为软硬件多元耦合失效、智能电网在单节点故障后故障随负载发生级联失效等等,且由于耦合故障的复杂性使即使执行相同测试用例时,复杂系统的故障也具有不确定性。而传统的可靠性分析手段常应用于单故障源头、静态分析的场景,对于这些机理复杂、结构耦合的故障类型使采用传统可靠性方法难以有效地实现故障定位分析,如何实现复杂系统故障定位成为一个亟待解决的问题。
[0003] 复杂网络理论作为一种抽象描述复杂系统整体结构与系统内部个体间交互规律的模型方法,对于解决这个问题提供了一种新的解决思路。基于复杂网络理论的动态多层耦合网络是对复杂系统内部不同层次的动态运行机制的抽象模型,其形式为一组时间切片下的静态多层耦合网络的集合,静态多层耦合网络由多个单层网络以及单层网络间的耦合边集组成。相比于传统可靠性模型,该模型可以更真实反应复杂系统正常运行以及故障运行情况下系统内部动态演化机理,结合网络模型的统计指标,可以更高效地分析故障传播路径、探究级联失效机理、实现多故障源定位等可靠性分析与提升任务。
[0004] 本发明针对于以上的问题提出了一种有效的解决方案。本方案主要对如何对复杂系统的故障定位问题提出了一套解决方案,首先执行高故障概率的测试用例,分别建立复杂系统正常与故障的动态耦合网络模型,然后基于复杂网络统计指标实现复杂系统故障粗略定位,定位复杂系统发生性能降级甚至崩溃的时间段,然后实现该时间段下的复杂系统故障精细定位,通过依次分析该时间段内各个时间切片下静态多层耦合网络中统计指标突变的节点,最终实现复杂系统的故障定位。本发明采用的基于动态多层耦合网络的复杂系统故障定位方法,解决了运用传统可靠性分析手段难以实现对复杂系统的动态传播、级联失效、多元故障等复杂故障进行定位的问题。

发明内容

[0005] 本发明主要提供一种基于动态多层耦合网络的复杂系统故障定位方法。传统可靠性分析手段常应用于单故障源头、静态分析的场景,在实现具有动态传播、级联失效、多元故障、不确定性等特点的复杂系统故障定位任务时存在局限性,难以实现故障定位分析。于是我们提出一种基于复杂网络理论可以有效实现复杂系统故障定位的方法。
[0006] 针对以上的技术问题以及本发明的目的,本文提出了一种基于动态多层耦合网络的复杂系统故障定位方法,方案包括如下部分:
[0007] (一)发明目的
[0008] 针对现有技术中存在的缺陷,本发明的目的在于提供一种基于动态多层耦合网络的复杂系统故障定位方法,在考虑到复杂系统的结构复杂、故障存在动态传播、级联失效、多层耦合等特点,常应用于静态故障与单故障场景的传统可靠性分析手段难以实现对复杂系统的故障定位,采用本发明提出的基于动态多层耦合网络的复杂系统故障定位方法可以通过运用复杂网络理论的统计指标从宏观与微观两个度对比分析复杂系统故障和正常动态多层耦合网络的异同,实现更清晰精准的复杂系统故障定位,便于系统设计人员了解系统的性能和故障机理,快速排查故障原因,优化系统可靠性指标。
[0009] (二)技术方案
[0010] 为了实现上述目的,本发明的方法所采用的技术方案是:一种基于动态多层耦合网络的复杂系统故障定位方法。
[0011] 本发明一种基于动态多层耦合网络的复杂系统故障定位方法,其步骤如下:
[0012] 步骤A:构建多模式下的动态多层耦合网络;
[0013] 步骤B:定位复杂系统故障时段;
[0014] 步骤C:定位复杂系统故障节点。
[0015] 其中,步骤A中所述的“动态多层耦合网络”,其具体含义为:可以抽象反映复杂系统内部动态运行状态的动态网络模型,动态网络模型为一组基于时间切片的静态网络,由于复杂系统常具有多个层次且各层之间除了同层交互还有跨层耦合,如嵌入式系统软件层与硬件层存在模的映射关系,故为了更真实描述系统状态,动态网络模型为包含多层节点、同层连边以及耦合连边的多层耦合网络;在步骤A中所述的“构建多模式下的动态多层耦合网络”,包括以下步骤:
[0016] 步骤A1:量化复杂系统的正常模式与故障模式;
[0017] 步骤A2:构建正常模式的动态多层耦合网络;
[0018] 步骤A3:构建故障模式的动态多层耦合网络;
[0019] 其中,在步骤A1中所述的“正常模式”,其具体含义为:复杂系统在执行某故障激发测试用例后,复杂系统处于正常运行的表现形式;
[0020] 其中,在步骤A1中所述的“故障模式”,其具体含义为:复杂系统在执行某故障激发测试用例后,复杂系统处于故障运行的表现形式;
[0021] 其中,在步骤A1中所述的“量化复杂系统的正常模式与故障模式”,其具体做法如下:量化复杂系统状态监控工具对于正常模式与故障模式相对应的性能指标,即规范不同故障现象对应的监测指标,以及系统正常运行时的监测指标;以嵌入式系统这类典型的软硬件综合系统为例,对于操作系统执行某操作后,反应延迟超过10s,认定系统发生阻塞故障;
[0022] 其中,在步骤A2中所述的“构建正常模式的动态多层耦合网络”,其具体做法如下:根据复杂系统的特性,选择合适的动态运行数据采样工具,执行某故障激发测试用例,在线采集在该故障激发测试用例下正常运行时的系统动态运行数据,然后基于复杂网络理论,抽取运行数据内部的节点交互关系,离线构建可以映射复杂系统正常模式运行机理的动态多层耦合网络;
[0023] 其中,在步骤A3中所述的“构建故障模式的动态多层耦合网络”,其具体做法如下:根据复杂系统的特性,选择合适的动态运行数据采样工具,执行某故障激发测试用例,在线采集在该故障激发测试用例下故障运行时的系统动态运行数据,然后基于复杂网络理论,抽取运行数据内部的节点交互关系,离线构建可以映射复杂系统正常模式运行机理的动态多层耦合网络;
[0024] 其中,在步骤A2和步骤A3中所述的“动态多层耦合网络”,其具体含义为:一组以时间为序的静态多层耦合网络的集合,每个静态多层耦合网络对应着一个动态运行数据的时间切片,设经过分割后的动态运行数据共有m片,则动态多层耦合网络中应包含m组静态多层耦合网络;由于节点间调用关系特别是耦合层的节点间调用关系存在方向性,故动态耦合网络的连边为有向连边,动态耦合网络为有向网络。
[0025] 其中,步骤B中所述的“定位复杂系统故障时段”,其具体含义为:通过对比步骤A构建的正常模式与故障模式下的动态多层耦合网络统计特征,发现故障发生的时段,并分别提取故障时段下故障模式与正常模式的动态多层耦合网络切片,为后续的步骤C的定位复杂系统故障节点提供支撑;包括以下步骤:
[0026] 步骤B1:校准不同模式下的动态多层耦合网络;
[0027] 步骤B2:计算不同模式下网络统计特征;
[0028] 步骤B3:量化故障指标;
[0029] 步骤B4:提取故障发生时段的动态多层耦合网络切片;
[0030] 其中,在步骤B1中所述的“校准不同模式下的动态多层耦合网络”,其具体做法如下:以执行的某故障激发测试用例为准,设某故障激发测试用例的开始执行的时刻为0时刻,校准不同模式下的动态多层耦合网络时间,并将执行某故障激发测试用例之前以及结束后的动态多层耦合网络数据剔除,仅保留与执行故障激发测试用例相关的动态多层耦合网络;
[0031] 其中,在步骤B2中所述的“网络统计特征”,其具体含义为:一组可以体现动态多层耦合网络不同时间间隔下的网络整体性质的统计指标,常见的指标有:网络规模、平均度、平均距离等。网络规模是在某时间间隔Tk下该网络中活跃的节点总数,可以衡量该时刻下复杂系统的工作强度;平均度是平均某时间间隔Tk下该网络内部所有节点的度,平均度可以衡量该时间间隔下复杂系统内部总体的连通程度的指标;平均距离是平均某时间间隔Tk下该网络内部任意两节点之间的距离均值,平均距离可以衡量该时间间隔下复杂系统内部的信息或者物质的传递效率。网络统计特征不局限于以上所举3例,因属于公知部分,不做赘述;
[0032] 其中,在步骤B2中所述的“计算不同模式下网络统计特征”,其具体做法如下:分别计算在正常模式与故障模式下动态多层耦合网络中各个时间间隔下静态多层耦合网络的网络规模、平均度、平均距离等统计特征及各类组合,并依时间序列保存计算结果;
[0033] 其中,在步骤B3中所述的“量化故障指标”,其具体做法如下:量化统计特征异常的标准,设时间间隔Tk下正常模式的某个统计特征的值为Pr,同一时间间隔下故障模式相同的统计特征的值为Pf,设故障指标 当α1≥k1,即故障指标不小于某个设定的常数阈值时,认定在此时间间隔内发生故障,由于在故障模式下复杂系统并不是全时段都处于故障状态,且复杂系统具有故障发生后自我修复的特性,因此故障发生时段的总时长应不大于故障激发测试用例的总时长;
[0034] 其中,在步骤B4中所述的“提取故障发生时段的动态多层耦合网络切片”,其具体做法如下:依次对比正常模式与故障模式在各个时间间隔下动态多层耦合网络切片的统计特征组合,计算各个时间间隔下的故障指标,寻找故障模式相对于正常模式统计特征异常时间片段,并提取统计特征异常时间片段下的动态多层耦合网络切片,为后续的步骤C复杂系统故障细定位提供数据支撑。
[0035] 其中,步骤C中所述的“定位复杂系统故障节点”,其具体含义为:通过对步骤B4保存的故障发生时段动态多层耦合网络切片进行分析,找到故障发生的节点,实现复杂系统故障的精细定位,便于系统设计人员完善系统结构,提升复杂系统可靠性;包括以下步骤:
[0036] 步骤C1:计算故障发生时段节点统计特征;
[0037] 步骤C2:量化故障指标;
[0038] 步骤C3:提取故障节点,输出故障信息;
[0039] 步骤C4:仿真验证;
[0040] 其中,在步骤C1中所述的“节点统计特征”,其具体含义为:一组可以体现动态多层耦合网络在故障发生时段下的每个节点特征的统计指标,常见的指标有:度和介数;网络节点的度是一个可以有效反应某节点与网络中其他节点直接的调用交互状态的指标,其定义为在某时间间隔Tk下某节点vi与其他节点直接相连的节点总数,对于有向网络,分为出度与入度;网络节点的介数是一个可以反映某节点在整体网络中影响力与重要程度的指标,其定义某时间间隔Tk下的网络中所有最短路径中经过某节点vi的数目占最短路径总数的比例;
[0041] 其中,在步骤C1中所述的“计算故障发生时段节点统计特征”,其具体做法如下:依次计算在故障发生时段的故障模式和正常模式动态多层耦合网络切片的度、介数等节点统计特征组合,并保存每个动态多层耦合网络切片的指标分布;
[0042] 其中,在步骤C2中所述的“量化故障指标”,其具体做法如下:量化统计特征异常的标准,设时间间隔Tk下的切片中,某节点vi在正常模式的某个统计特征的值为Prv,同一时间间隔下故障模式相同的统计特征的值为 设故障指标 当α2≥k2,即故障指标不小于某个设定的常数阈值时,认定在此时间间隔内该节点发生异常;
[0043] 其中,在步骤C3中所述的“提取故障节点,输出故障信息”,其具体做法如下:依次计算每个节点故障发生时段下所有动态耦合网络切片中的故障指标,并提取各个动态耦合网络切片中超出设定阈值的节点,被提取的节点集合即为故障节点,统计故障节点出现频次等故障报告;
[0044] 其中,在步骤C4中所述的“仿真验证”,其具体做法如下:输入步骤C3提取的故障节点到该复杂系统动态多层耦合网络模型中,以故障频次为序,基于渗流理论针对该网络模型实施蓄意攻击,观察网络模型受到攻击后的故障效果是否与实际状态拟合,并依据仿真结果输出故障险评估,便于系统设计人员优化系统薄弱节点。
[0045] 通过以上步骤,本方法提出了一种基于动态多层耦合网络的复杂系统故障定位方法,解决了传统可靠性分析手段对于复杂系统的动态传播、级联失效、多元故障、不确定性等特性下故障定位任务时存在的局限性,基于复杂网络理论实现了复杂系统的故障定位分析。该复杂系统故障定位方法可快速地挖掘故障节点,且经过仿真分析双重验证,具有良好的实际应用价值。
[0046] (三)优点创新
[0047] 本发明具有如下的创新点:
[0048] 1.定位迅速:本发明中所采用的基于动态多层耦合网络的复杂系统故障定位方法,首先分析可以体现网络整体性质的统计指标,实现定位复杂系统的故障时段,接着分析故障时段下动态多层耦合网络切片中每个节点统计指标,实现故障节点的精细定位,避免了因计算机算力瓶颈导致的传统故障定位方法定位慢的缺点;
[0049] 2.移植方便:本发明所设计的复杂系统故障定位方法适用于多类复杂系统,应用于不同类型的复杂系统时,只需依据需故障定位的复杂系统特性对步骤A“构建多模式下的动态多层耦合网络”进行适配,即可快速实现本专利所提出的故障定位方法的移植,无需进行大规模修改,构建方法移植性强,减少设计人员的工作量;
[0050] 3.方法先进:依据本发明所提出的基于动态多层耦合网络的复杂系统故障定位方法,采用复杂网络的统计分析方法可解决传统可靠性分析手段难以实现对复杂系统的动态传播、级联失效、多元故障等复杂故障进行定位的问题,具有一定的方法先进性。
[0051] 综上,这种基于动态多层耦合网络的复杂系统故障定位方法为工程应用中的复杂系统故障定位提供一种很好的解决方案。附图说明
[0052] 图1是本发明所述方法流程图

具体实施方式

[0053] 为使本发明要解决的技术问题、技术方案更加清楚,下面将结合附图及具体实施案例进行详细描述。应当理解,此处所描述的实施实例仅用于说明和解释本发明,并不用于限定本发明。
[0054] 本发明的目的在于解决传统可靠性分析手段常应用于单故障源头、静态分析的场景,难以对复杂系统的动态传播、级联失效、多元故障等复杂故障进行定位的问题。这里我们提出一种针对复杂系统故障的复杂故障机理实现高效定位的故障定位方法,该方法无需计算对比所有节点特征信息,可较少占用计算机算力的前提下快速地定位复杂系统的故障节点,具有良好的实际应用价值。
[0055] 下面结合附图说明及具体实施方式对本发明进一步说明。
[0056] 本发明实施例以对某型嵌入式开发平台故障定位为例,阐述本发明方法。具体地说,该嵌入式开发平台的底层软件层存在未知驱动故障,当对该嵌入式开发平台施加高强度计算负载、系统硬件层陷入算力瓶颈时,由于底层软件驱动异常导致该型嵌入式计算机系统长时间卡顿无法完成既定任务,故需要基于动态多层耦合网络对该嵌入式开发平台实施故障定位分析,便于系统设计人员提升系统的可靠性等性能。
[0057] 为了实现上述目的,本发明的方法所采用的技术方案是:一种针对复杂系统故障的复杂故障机理实现高效定位的故障定位方法。其流程如图1所示:
[0058] 步骤A:构建多模式下的动态多层耦合网络;
[0059] 步骤B:定位复杂系统故障时段;
[0060] 步骤C:定位复杂系统故障节点。
[0061] 其中,步骤A中所述的“动态多层耦合网络”,其具体含义为:可以抽象反映复杂系统内部动态运行状态的动态网络模型,在具体实施方式中为可以刻画某型嵌入式开发平台执行故障激发测试用例后系统内部运行状态的网络模型,动态网络模型为一组基于时间切片的静态网络,为了更真实描述系统状态,动态网络模型为包含多层节点、同层连边以及耦合连边的多层耦合网络;所述的“构建多模式下的动态多层耦合网络”,包括以下步骤:
[0062] 步骤A1:量化复杂系统的正常模式与故障模式;
[0063] 步骤A2:构建正常模式的动态多层耦合网络;
[0064] 步骤A3:构建故障模式的动态多层耦合网络;
[0065] 其中,在步骤A1中所述的“正常模式”,其具体含义为:某型嵌入式开发平台在执行故障激发测试用例后,某型嵌入式开发平台处于正常运行的表现形式;
[0066] 其中,在步骤A1中所述的“故障模式”,其具体含义为:某型嵌入式开发平台在执行故障激发测试用例后,某型嵌入式开发平台处于故障运行的表现形式;
[0067] 其中,在步骤A1中所述的“量化复杂系统的正常模式与故障模式”,其具体做法如下:量化某型嵌入式开发平台状态监控工具对于正常模式与故障模式相对应的性能指标,即规范不同故障现象对应的监测指标,以及系统正常运行时的监测指标,对于该嵌入式开发平台施加的测试用例下的故障指标可以设为系统对于测试用例的反应延迟超过10s,认定系统发生阻塞故障;
[0068] 其中,在步骤A2中所述的“构建正常模式的动态多层耦合网络”,其具体做法如下:根据某型嵌入式开发平台的特性,选择合适的动态运行数据采样工具,执行故障激发测试用例,在线采集在该故障激发测试用例下正常运行时的系统动态运行数据,然后基于复杂网络理论,抽取运行数据内部的节点交互关系,离线构建可以映射某型嵌入式开发平台正常模式运行机理的动态多层耦合网络;
[0069] 其中,在步骤A3中所述的“构建故障模式的动态多层耦合网络”,其具体做法如下:根据某型嵌入式开发平台的特性,选择合适的动态运行数据采样工具,执行故障激发测试用例,在线采集在该故障激发测试用例下故障运行时的系统动态运行数据,然后基于复杂网络理论,抽取运行数据内部的节点交互关系,离线构建可以映射某型嵌入式开发平台正常模式运行机理的动态多层耦合网络;
[0070] 其中,在步骤A2和步骤A3中所述的“动态多层耦合网络”,其具体含义为:一组以时间为序的静态多层耦合网络的集合,每个静态多层耦合网络对应着一个动态运行数据的时间切片,经过分割后的动态运行数据共有2210片,动态多层耦合网络中应包含2210组静态多层耦合网络;由于节点间调用关系特别是耦合层的节点间调用关系存在方向性,故动态耦合网络的连边为有向连边,动态耦合网络为有向网络。
[0071] 其中,步骤B中所述的“定位复杂系统故障时段”,其具体含义为:通过对比步骤A构建的正常模式与故障模式下的动态多层耦合网络统计特征,发现故障发生的时段,并分别提取故障时段下故障模式与正常模式的动态多层耦合网络切片,为后续的步骤C的定位复杂系统故障节点提供支撑;包括以下步骤:
[0072] 步骤B1:校准不同模式下的动态多层耦合网络;
[0073] 步骤B2:计算不同模式下网络统计特征;
[0074] 步骤B3:量化故障指标;
[0075] 步骤B4:提取故障发生时段的动态多层耦合网络切片;
[0076] 其中,在步骤B1中所述的“校准不同模式下的动态多层耦合网络”,其具体做法如下:以执行的故障激发测试用例为准,设故障激发测试用例的开始执行的时刻为0时刻,校准不同模式下的动态多层耦合网络时间,并将执行故障激发测试用例之前以及结束后的动态多层耦合网络数据剔除,仅保留与执行故障激发测试用例相关的动态多层耦合网络,经过处理后原有的2210片切片仅保留其中的1950片;
[0077] 其中,在步骤B2中所述的“网络统计特征”,其具体含义为:一组可以体现动态多层耦合网络不同时间间隔下的网络整体性质的统计指标,常见的指标有:网络规模、平均度、平均距离等,对于具体实施方式,需要计算某型嵌入式开发平台的动态多层耦合网络的网络规模、平均度和平均距离三个网络统计特征;
[0078] 其中,在步骤B2中所述的“计算不同模式下网络统计特征”,其具体做法如下:分别计算在正常模式与故障模式下动态多层耦合网络中各个时间间隔下静态多层耦合网络的网络规模、平均度、平均距离等统计特征的组合,并依时间序列保存计算结果;
[0079] 其中,在步骤B3中所述的“量化故障指标”,其具体做法如下:量化统计特征异常的标准,设时间间隔Tk下正常模式的某个统计特征的值为Pr,同一时间间隔下故障模式的统计特征的值为Pf,设故障指标 当α1≥k1,即故障指标不小于某个设定的常数阈值时,认定在此时间间隔内发生故障,对于具体实施方式,将常数设为k1=0.3;
[0080] 其中,在步骤B4中所述的“提取故障发生时段的动态多层耦合网络切片”,其具体做法如下:依次对比正常模式与故障模式在各个时间间隔下动态多层耦合网络切片的统计特征组合,计算各个时间间隔下的故障指标,寻找故障模式相对于正常模式统计特征异常时间片段,并提取统计特征异常时间片段下的动态多层耦合网络切片,对于两组不同模式,每种模式共1950片经过校准后的动态多层耦合网络经过步骤B4提取后,发现有故障模式下有42片符合提取标准,故提取故障模式下这42片动态多层耦合网络切片,以及与其时间对应的42片正常模式下的动态多层耦合网络切片,后续的步骤C复杂系统故障细定位提供数据支撑。
[0081] 其中,步骤C中所述的“定位复杂系统故障节点”,其具体含义为:通过对步骤B4保存的故障发生时段动态多层耦合网络切片进行分析,找到故障发生的节点,实现某型嵌入式开发平台故障的精细定位,便于系统设计人员完善系统结构,提升复杂系统可靠性;包括以下步骤:
[0082] 步骤C1:计算故障发生时段节点统计特征;
[0083] 步骤C2:量化故障指标;
[0084] 步骤C3:提取故障节点,输出故障信息;
[0085] 步骤C4:仿真验证;
[0086] 其中,在步骤C1中所述的“节点统计特征”,其具体含义为:一组可以体现动态多层耦合网络在故障发生时段下的每个节点特征的统计指标,常见的指标有:度和介数,对于具体实施方式,需要计算某型嵌入式开发平台的动态多层耦合网络切片的度和介数这两个节点统计特征;
[0087] 其中,在步骤C1中所述的“计算故障发生时段节点统计特征”,其具体做法如下:依次计算在故障发生时段的故障模式和正常模式动态多层耦合网络切片的度和介数节点统计特征组合,并保存每个动态多层耦合网络切片的指标分布;
[0088] 其中,在步骤C2中所述的“量化故障指标”,其具体做法如下:量化统计特征异常的v标准,设时间间隔Tk下的切片中,某节点vi在正常模式的某个统计特征的值为Pr ,同一时间间隔下故障模式相同的统计特征的值为 设故障指标 当α2≥k2,即故障指标不小于某个设定的常数阈值时,认定在此时间间隔内该节点发生异常,对于具体实施方式,将常数设为k2=0.25;
[0089] 其中,在步骤C3中所述的“提取故障节点,输出故障信息”,其具体做法如下:依次计算每个节点故障发生时段下所有动态耦合网络切片中的故障指标,并提取各个动态耦合网络切片中超出设定阈值的节点,被提取的节点集合即为故障节点,统计故障节点出现频次等故障报告;
[0090] 其中,在步骤C4中所述的“仿真验证”,其具体做法如下:输入步骤C3提取的故障节点到该复杂系统动态多层耦合网络模型中,以故障频次为序,基于渗流理论针对该网络模型实施蓄意攻击,观察网络模型受到攻击后的故障效果与实际状态拟合,并依据仿真结果输出故障风险评估。
[0091] 本发明未详细阐述部分属于本领域公知技术。
[0092] 以上所述,仅为本发明部分具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域的人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈