专利类型 | 发明公开 | 法律事件 | 公开; 实质审查; 授权; |
专利有效性 | 有效专利 | 当前状态 | 授权 |
申请号 | CN201710884397.9 | 申请日 | 2017-09-26 |
公开(公告)号 | CN107579771A | 公开(公告)日 | 2018-01-12 |
申请人 | 中国人民解放军国防信息学院; | 申请人类型 | 学校 |
发明人 | 张海粟; 王龙; 刘鹏飞; 王芳; 李韬伟; 李华初; 李行; 吴照林; 曾昭文; 戴剑伟; 徐飞; 文峰; 左青云; | 第一发明人 | 张海粟 |
权利人 | 中国人民解放军国防信息学院 | 权利人类型 | 学校 |
当前权利人 | 中国人民解放军国防信息学院 | 当前权利人类型 | 学校 |
省份 | 当前专利权人所在省份:湖北省 | 城市 | 当前专利权人所在城市:湖北省武汉市 |
具体地址 | 当前专利权人所在详细地址:湖北省武汉市江岸区解放公园路45号 | 邮编 | 当前专利权人邮编:430014 |
主IPC国际分类 | H04B10/07 | 所有IPC国际分类 | H04B10/07 ; H04L12/24 ; G06K9/62 |
专利引用数量 | 4 | 专利被引用数量 | 0 |
专利权利要求数量 | 8 | 专利文献类型 | A |
专利代理机构 | 武汉科皓知识产权代理事务所 | 专利代理人 | 严彦; |
摘要 | 本 发明 提供一种基于单条告警向前回溯的光纤传送网智能告警方法,包括收集光纤传送网告警和故障信息,设置告警回溯时间段和故障预测时间段,进行单条告警特征提取和告警回溯特征提取,进行故障标注;构建训练集,构建智能告警学习器,构建测试集评估智能告警学习器模型,根据通过评估的模型进行预测。区别于以往光纤传送网告警与故障关系限于故障诊断的研究,本发明将告警信息实时、序列化的特点应用于故障预测中,实现了单条告警信息就能指示故障存在与否的预测,并能够集成于光纤传送网运维系统,为进一步使用研究智能告警打下了 基础 。 | ||
权利要求 | 1.一种基于单条告警向前回溯的光纤传送网智能告警方法,包括以下步骤: |
||
说明书全文 | 一种基于单条告警向前回溯的光纤传送网智能告警方法技术领域背景技术[0002] 以光纤为骨干网传输介质的光纤传送网带宽高、成本低,已成为支撑全国乃至世界范围内信息高速公路的重要基石。保持网络畅通、及时处理故障是维护光纤传送网的主要任务,也是最为繁重、消耗人力物力资源最多的工作。对光纤传送通信网的故障进行有效预测、快速感知、精准定位,可以提高光纤传送通信网的运行质量,降低运营成本。 [0003] 告警是光纤传送网网络运维系统发出的报告,具有规模大、碎片化、多重复、高冗余、时间序列化等的特点。光纤传送网告警信息可分为:AU指针丢失、TU指针丢失、R_LOS等不同类别。这些告警信息彼此关联,有些指示了线路断裂等光纤传送网显性故障,有些则反映了传送网中设备性能的衰减,都需要从大量的信息挖掘才能推断故障类型定位故障发生位置。因此,告警是分析故障、定位故障的关键信息。 [0004] 目前,关于告警与故障的研究主要集中在利用告警信息对光纤传送网进行诊断故障。故障诊断是一种后验的方法,是在故障发生之后进行的。但告警在网络运维系统中是根据网络情况,由网络设备实时发送的。也就是说,告警不仅仅是一种具有极高分析价值的历史数据,还是一种按照成时间序列分布的实时数据。因此,可以尝试根据时序数据对网络状态进行预测,也就说明告警具有潜藏的预测价值。 [0005] 故障预测是一门实用价值极高的研究。通过对电子以及机械设备的寿命进行统计分布,从而达到预测的目的,但在通信设备方面研究较少。光纤传送网的特点是告警信息量大、故障发生后衍生告警信息发生在故障以及联通设备之上,需要在网络环境中统计分析,不同于电子、机械等设备状态信息呈现的特点。因此,本领域亟待相关有效技术方案出现。 [0006] 文中涉及的参考文献如下: [0007] [1]孙朝晖,张德运,李庆海.网络故障管理中的自动告警关联[J].计算机工程30.5(2004):30-31. [0009] [3]郑庆国,吕卫锋.通信网络中的告警相关性研究[J].计算机工程与应用,2002,38(2):11-14. [0010] [4]彭喜元,刘宇,刘大同.数据驱动的故障预测[M].哈尔滨工业大学出版社,2016. [0011] [5]彭宇,刘大同.数据驱动故障预测和健康管理综述[J].仪器仪表学报,2014,35(3):481-495. [0012] [6]Williard N,He W,Hendricks C,et al.Lessons Learned from the 787Dreamliner Issue on Lithium-Ion Battery Reliability[J].Energies,2013,6(9): 4682-4695. [0013] [7]Schwabacher M.A Survey of Data-Driven Prognostics[C]//2013.[0014] [8]周志华.机器学习[M].清华大学出版社,2016. 发明内容[0015] 针对以上问题,本发明目的是提供构建一种基于单条告警向前回溯的光纤传送网智能告警方法。通过收集当前告警向前回溯时间段告警信息以及光纤传送网故障信息,提取回溯时间段告警特征,利用机器学习算法构建智能告警学习器,实现基于当前告警预测未来一定时间范围内故障发生的概率。 [0016] 为达到上述目的,本发明采用一种基于单条告警向前回溯的光纤传送网智能告警方法,包括以下步骤: [0017] 步骤1,收集光纤传送网告警和故障信息,其中,告警数据集记为A={alm1,alm2,...,almM},M为告警总数,alm1,alm2,...,almM为告警数据集中记录的告警,故障数据集记为F={flt1,flt2,...,fltN},N为故障总数,flt1,flt2,...,fltN为故障数据集中记录的故障; [0018] 步骤2,告警与故障数据预处理,包括以下步骤: [0019] 步骤2.1,设置告警回溯时间段和故障预测时间段,实现如下, [0020] 定义单条告警almi∈A发生时刻为talm,向前回溯时刻为tback,回溯时间段为[tback,talm),向后预测时刻为tpredict,预测时间段为(talm,tpredict],单位时间间隔为Δt,[tback,talm)=mΔt,(talm,tpredict]=nΔt,其中,Δt>0,m>0,n>0; [0021] 记单条告警almi∈A回溯子集A_back={alm1,alm2,...,almM'},其中M'为子集告警总数,告警信息收集条件为, [0022] 有tback<tz<talm, [0023] 单条告警almi∈A相应的故障预测子集F_predict={flt1,flt2,...,fltN'},其中N'为子集故障总数,故障数据收集条件为, [0024] 有talm<ts<tpredict||ts<talm<te, [0025] 步骤2.2,单条告警特征提取,实现如下, [0026] 对任一单条告警almi∈A,特征记为 [0027] A_feature={alm_feature1,alm_feature2,...,alm_featureP}, [0028] 其中,P为单条告警特征总数,alm_feature1,alm_feature2,...,alm_featureP分别为单条告警信息特征,alm_featureP等于告警集中第p种特征的告警数量,p=1,2,…,P; [0029] 步骤2.3,告警回溯特征提取,实现如下, [0030] 采用告警almi∈A的回溯子集A_back统计和作为模型输入的特征B_feature,B_feature={bak_feature1,bak_feature2,...,bak_featureS},其中,S为回溯告警特征总数,bak_feature1,bak_feature2,...,bak_featureS分别为回溯告警信息特征,bak_features等于告警集中第s种特征的告警数量; [0031] 步骤2.4,故障标注,实现如下, [0032] 对于单条almi∈A故障标注为故障子集F_predict统计和,统计和大于零为出现故障,反之为未出现故障,故障标注集F_feature={flt_feature},其中flt_feature取值为{出现故障|未出现故障}; [0033] 步骤3,构建训练集,采用支持向量机SVM构建智能告警学习器, [0034] 所述构建训练集的实现如下, [0035] 对于训练集Feature={feature1,feature2,...,featureM},其中,M为告警总数,对于单条告警almi∈A完整数据记录如下, [0036] [0037] 其中,包括单条告警特征A_feature,向前回溯特征B_feature,故障标注F_feature; [0038] 记AB_Feature={AB_feature1,AB_feature2,...,AB_featureM}其中,M为告警总数,对于单条告警almi∈A有, [0039] [0040] 步骤4,构建测试集评估智能告警学习器模型,根据通过评估的模型进行预测。 [0041] 而且,步骤2.2中,P=6,alm_feature1,alm_feature2,...,alm_featureP分别是:数据包类型、对象类别、告警级别、设备类型、可能原因和设备生产厂家。 [0042] 而且,步骤2.3中,S=18,即bak_feature1,bak_feature2,...,bak_feature18分别为:数据包类型SL1统计和、数据包类型SL2统计和、数据包类型SQ1统计和、数据包类型EFS统计和、数据包类型EST统计和、数据包类型ASCC统计和、数据包类型LWM统计和、告警级别warning统计和、告警级别minor统计和、告警级别major统计和、告警级别critical统计和、可能原因AU_AIS统计和、可能原因TU_LOP统计和、可能原因R_LOS统计和、可能原因R_LOF统计和、可能原因T_ALOS统计和、可能原因T_LOS统计和和可能原因TU_AIS统计和。 [0043] 4.根据权利要求3所述的大倾斜远端观测环境目标定位方法,其特征在于:对bak_feature1,bak_feature2,...,bak_feature18分别进行归一化操作,设其中任一种属性数据记为bak_features,s=1,2,…,S,归一化公式如下, [0044] [0045] 其中,bak_featuretotal为当前观测时间段内所有告警记录总数,归一化后得到的是在观测时间段内某一特征告警数量占所有告警数量的比值。 [0046] 而且,采用支持向量机SVM构建智能告警学习器,以最大分类间隔为准则,通过构建最优分类超平面对样本空间进行划分,从而达到对告警进行分类。 [0047] 而且,采用支持向量机SVM构建智能告警学习器的实现方式为,对于训练集Feature,根据SVM原理将智能告警问题转化为目标函数最优化问题,将告警分类带约束最优化问题转化为无约束最优化问题, [0048] 采用可分离性较好的高斯核作为核函数,定义为 [0049] [0050] 其中,σ>0为高斯核函数带宽。 [0051] 而且,步骤4中,评估智能告警学习器模型效果,如果满足条件则根据通过评估的模型进行预测,如果不满足则调整参数重新构建智能告警学习器,直到满足条件。 [0052] 而且,步骤4中,测试集采用交叉验证法构建,包括令测试集数据采集周期为q*Δt,初始时刻以r*Δt开始起算,其中,q>1,0<r<1,测试集为训练集向后平移一个非整数时刻,并且数据采集周期大于训练集采集周期。 [0053] 本发明具有以下优点和积极效果: [0054] 1)本发明充分使用了光纤传送网告警信息。区别于以往光纤传送网告警与故障关系限于故障诊断的研究,将告警信息实时、序列化的特点应用于故障预测中。故障预测与故障诊断同样重要,本发明是告警信息在故障预测的有益尝试。 [0055] 2)本发明将在数据驱动的故障预测技术应用于光纤传送网,设计了告警回溯时间段、故障预测时间段,并提出了单条告警特征、回溯特征、故障标注等特征。 [0056] 3)本发明在所提出的特征基础之上,运用SVM设计了智能告警学习器。该学习器实现了单条告警信息就能指示故障存在与否的预测,并能够集成于光纤传送网运维系统,为进一步使用研究智能告警学习器打下了基础,具有重要市场价值。附图说明 [0058] 图2是本发明实施例的告警回溯时间段和故障预测时间段示意图。 具体实施方式[0059] 下面结合附图和实施例对本发明作进一步说明。 [0060] 本文通过对光纤传送网告警故障信息量大、分布广的特点分析,针对当前光纤传送网告警故障预测研究较少且实际应用复杂的不足,提出一种基于单条告警向前回溯的光纤传送网智能告警方法,在实际工作中有一定的效果,对光纤传送网的维护与管理起到了积极的作用。 [0061] 本发明针对光纤故障原因分析太过复杂,排障往往需要从大量告警信息里挖掘故障原因的现状,提出一种能快速提供故障的预测,且不需要找千丝万缕的复杂关系的技术方案。本发明实施例对采集的告警与故障历史数据按时间序列进行排列,面向单条告警的发生时刻,将数据集划分为该时刻向前告警回溯时间段和向后故障预测时间段,在单条告警上提取告警特征,在向前告警时间段提取回溯特征,在向后故障时间段标注故障,将告警特征、回溯特征和标注故障构成一组对应的数据集,采用优化的SVM对数据集进行学习,通过训练集训练得到基于告警特征的故障预测学习器。 [0062] 参见图1,实施例提供的基于单条告警向前回溯的光纤传送网智能告警方法包括具体步骤如下: [0063] 步骤1,收集光纤传送网告警和故障信息 [0064] 本发明提出的方法须根据光纤传送网上拓扑结构,收集一段历史时间T内某几条彼此联通线路上的设备告警和故障信息,按时间顺序整理排列,其中,告警数据集记为A={alm1,alm2,...,almM},M为告警总数,alm1,alm2,...,almM为每一条告警记录,故障数据集记为F={flt1,flt2,...,fltN},N为故障总数,flt1,flt2,...,fltN为每一条故障记录。本实施例中,收集了2017-1-1 00:00:00到2017-2-28 23:59:59时间段内,京广线沿线构成的彼此联通线路,每条历史告警信息包含:告警发生时间tz、台站代号、设备代号、数据包类型等,每条历史故障信息包含:故障的开始时间ts、故障结束时间te、台站代号、设备代号等。 [0065] 告警信息数据结构及样例数据见表1: [0066] 表1告警样例数据 [0067] [0068] 故障信息数据结构及样例数据见表2: [0069] 表2故障样例数据 [0070] [0071] 步骤2,告警与故障数据预处理 [0072] 通过步骤1得到时间序列的告警与故障信息,在该信息上根据单条告警设置向前告警回溯时间段和向后故障预测时间段,提取告警特征、回溯特征和标注故障,构建数据训练集与测试集,为后续学习器训练做好数据准备。 [0073] 步骤2.1设置告警回溯时间段和故障预测时间段 [0074] 本发明中故障预测是指从某单条告警发生时刻起,利用向前回溯一个时间段的告警信息特征,预计未来一段时间内故障是否出现的预测。因此,首先需要对回溯时间段和预测时间段进行设置。为了能够更准确的描述与控制各时间段,须在设置阶段引入单位时间间隔。 [0075] 参见图2,定义当前时间即单条告警almi∈A发生时刻为talm,向前回溯时刻为tback,回溯时间段为[tback,talm),向后预测时刻为tpredict,预测时间段为(talm,tpredict],单位时间间隔为Δt,[tback,talm)=mΔt,(talm,tpredict]=nΔt,其中,Δt>0,m>0,n>0。 [0076] 故有,单条告警almi∈A回溯子集A_back={alm1,alm2,...,almM'},其中M'为子集告警总数,告警信息收集条件为: [0077] 有tback<tz<talm, [0078] 即若告警数据集A内某条告警发生时间tz在告警回溯时间段内,则该条历史告警信息采集。 [0079] 故有,单条告警almi∈A相应的故障预测子集F_predict={flt1,flt2,...,fltN'},其中N'为子集故障总数,故障数据收集条件为: [0080] 有talm<ts<tpredict||ts<talm<te, [0081] 即若故障数据集F内某条故障开始时间ts在预测时间段内,或者告警发生时间在故障持续时间段内,则该条历史故障信息被采集。 [0082] 本实施例中,告警回溯时间段为36小时,预测时间段为12小时,单位时间间隔为1小时,即:Δt=1h,m=36,n=12。起始时间为7:00:00,即通过两昼一夜预测一昼或者是通过两夜一昼预测一夜故障出现的可能。 [0083] 步骤2.2单条告警特征提取 [0084] 由表1可得告警数据主要包括:告警编号、发生时间、台站代号、设备代号、数据包类型、对象类别、告警级别、设备类型、可能原因和设备生产厂家等。 [0085] 即对任一单条告警almi∈A特征为 [0086] A_feature={alm_feature1,alm_feature2,...,alm_featureP}, [0087] 其中,P为单条告警特征总数,alm_feature1,alm_feature2,...,alm_featureP分别为单条告警信息特征,即alm_featureP为告警集中第p种特征的告警数量,p=1,2,…,P。 [0088] 本发明采用的特征数据项P=6, [0089] alm_feature1,alm_feature2,...,alm_featureP分别是:数据包类型、对象类别、告警级别、设备类型、可能原因和设备生产厂家。设备生产厂家等可设置相应序号作为对应记录。 [0090] 步骤2.3告警回溯特征提取 [0091] 回溯特征是指在回溯时间段内告警信息的特征,该时间段内告警数目多,对告警进行统计描述,构建时间段告警回溯特征。 [0092] 本发明采用告警信息almi∈A的回溯子集A_back统计和作为模型输入的特征B_feature,即为:B_feature={bak_feature1,bak_feature2,...,bak_featureS},其中,S为回溯告警特征总数,bak_feature1,bak_feature2,...,bak_featureS分别为回溯告警信息特征,即bak_features为告警集中第s种特征的告警数量,s=1,2,…,S。 [0093] 在本实施例中,单条告警信息有:数据包类型、对象类别、告警级别、设备类型、可能原因、设备生产厂家等信息,对应方案采集特征总数S=18,即bak_feature1,bak_feature2,...,bak_feature18分别为:数据包类型SL1统计和、数据包类型SL2统计和、数据包类型SQ1统计和、数据包类型EFS统计和、数据包类型EST统计和、数据包类型ASCC统计和、数据包类型LWM统计和、告警级别warning统计和、告警级别minor统计和、告警级别major统计和、告警级别critical统计和、可能原因AU_AIS统计和、可能原因TU_LOP统计和、可能原因R_LOS统计和、可能原因R_LOF统计和、可能原因T_ALOS统计和、可能原因T_LOS统计和和可能原因TU_AIS统计和。这些特征是光线传送网诊断故障分析原因最常用的信息,因此,在本方法故障预测中同样选用这些属性作为特征。特征变量获取的方法,形如:bak_feature1=count{包类型SL1},bak_feature1为包类型SL1的告警数量。 [0094] 由于针对单条告警向前回溯时间段内特征统计和总数不同,需对数据进行归一化处理,即:bak_feature1,bak_feature2,...,bak_feature18分别进行归一化操作,设其中任一种属性数据记为bak_features,s=1,2,…,S,实施例中S=18,归一化公式: [0095] [0096] 其中,bak_featuretotal为当前观测时间段内所有告警记录总数,归一化后得到的是在观测时间段内某一特征告警数量占所有告警数量的比值。 [0097] 步骤2.4故障标注 [0098] 故障标注采用二分类模型标注的方法,只标注在预测时间段内是否出现故障。对于单条almi∈A故障标注为故障子集F_predict统计和,统计和大于零为出现故障,反之为未出现故障,即故障标注集F_feature={flt_feature}其中flt_feature取值为{出现故障|未出现故障}。具体实施时可以用0或1表示。 [0099] 步骤3,构建训练集,构建智能告警学习器 [0100] 首先,综合上述步骤可得,对于训练集Feature={feature1,feature2,...,featureM},其中,M为告警总数,同步骤1中告警采集总数,对于单条告警almi∈A完整数据记录为: [0101] [0102] 其中,包括单条告警特征A_feature,向前回溯特征B_feature,故障标注F_feature。 [0103] 本发明提出,告警信息与故障有关,回溯是告警信息的统计特征。为便于下文描述,记AB_Feature={AB_feature1,AB_feature2,...,AB_featureM}其中,M为告警总数,同步骤1中告警采集总数,对于单条告警almi∈A有: [0104] [0105] 然后,构建智能告警学习器 [0106] 本文方法的目的在于判断预测时间内故障存在与否,因此,在分类问题中属于一个典型的二分类方法。分类的方法有很多,如:决策树、支持向量机、朴素贝叶斯以及基于规则的分类等。针对光纤传送网告警的特点,本实施例提出采用支持向量机(SVM)算法构建智能告警学习器,该方法以最大分类间隔为准则,通过构建最优分类超平面对样本空间进行划分,从而达到对告警进行分类的目的。 [0107] 通过步骤1、2,得到光纤传送网单条告警和告警回溯时间段的全部特征描述。对于训练集Feature,根据SVM原理智能告警问题可转化为如下目标函数最优化问题,即: [0108] [0109] s.t.,F_featurei(wTφ(AB_featurei)+b)≥1-ξi,i=1,...,M [0110] ξi≥0,i=1,...,M [0111] 其中w和b为定义分类超平面wTφ(AB_featurei)+b=0的参数向量,C是一个常量用于控制目标函数中两项之间的权重,ξi表示松弛变量,φ(AB_featurei)表示训练样本AB_featurei的非线性映射,F_featurei表示第i个训练样本AB_featurei的类别标号,M为训练集样本的个数,与步骤2.1中M的定义一致。 [0112] 进一步,需要将本例中告警分类带约束最优化问题转化为无约束最优化问题,引入拉格朗日乘子α,r,代价函数则有: [0113] [0114] 即拉格朗日乘子αi≥0,ri≥0为需要优化的变量。对偶函数是原问题最优解的一个下界,当满足KKT(Karush-Kuhn-Tucker)条件时,对偶问题与原问题是等价的。那么,对于本实施例问题即可转化为对偶问题的最优化,有: [0115] [0116] s.t.,0≤αi≤C,i=1,...,M [0117] [0118] 其中,j=1,...,M,参数向量w和变量α之间满足K(AB_featurei,AB_featurej)为自定义的一种核函数,其目的是将样本在特征空间中的内积操作转化成样本在原始空间中的核函数映射,F_featurej表示第j个训练样本AB_featurei的类别标号。本发明实施例优选采用可分离性较好的高斯核作为核函数,定义为: [0119] [0120] 其中,σ>0为高斯核函数带宽。通过解上述优化问题得到变量{αi}i=1,...,M的最优值,得到告警SVM分类器模型参数的训练过程,完成模型构建,分类模型如下所示: [0121] [0122] 其中,Hi为训练集中第i个单条告警及告警回溯时间段的告警特征,H(t)为待预测的某个时刻t相应单条告警及告警回溯时间段的告警特征,输入H(t)可得到待预测的某个时刻相应故障预测时间段内故障预测特征F_feature,预测有故障出现取值为1,没有故障出现取值为0。 [0123] 步骤4,构建测试集评估智能告警学习器模型,根据通过评估的模型进行预测。 [0124] 步骤4.1构建测试集 [0125] 测试集是评估模型性能的数据集,须尽可能不与训练集有交集,且数据量比训练集少,常用的方法有:留出法、交叉验证法、自助法等。根据告警信息特点,本发明采用交叉验证法,即令测试集数据采集周期为q*Δt,初始时刻以r*Δt开始起算,其中,q>1,0<r<1,测试集为训练集向后平移一个非整数时刻,并且数据采集周期大于训练集采集周期。本实施例中由于通常情况下训练集为测试集的4-5倍,那么测试集数据采集周期为5*Δt,初始时刻以0.5*Δt开始起算。测试集和预测所用数据的特征数据采集方式和步骤2对训练集的采集方式一致。 [0126] 步骤4.2智能告警学习器效果评估 [0127] 将样例根据真实类别与学习其预测类别的组合划分为真正例、假正例、真反例、假反例四种情形,令TP、FP、TN、FN分别表示其对应的样例数,则显然有TP+FP+TN+FN=样例总数。 [0128] 查全率R与查准率P用以评价学习效果的指标,分别定义为: [0129] [0130] 查全率与查准率是一对矛盾度量,需使用F度量评价指标平衡查全率与查准率。由于在故障预测中更希望尽可能少漏掉,故障发生的可能,那么,对于F度量中β>1,查全率有更重要的作用,即: [0131] [0132] 当F值满足条件时输出模型,即可根据预测模型进行故障模型。具体实施时,本领域技术人员可以预设相应条件。 [0133] 进一步地,根据智能告警学习器模型评估效果,如果满足条件则根据通过评估的模型进行预测,如果不满足则调整参数(例如核函数),按照步骤3的方式重新构建智能告警学习器,直到学习器在测试集上满足条件。具体实施时,本发明技术方案可采用计算机软件技术实现自动运行流程。 [0134] 以上实施例仅供说明本发明之用,而非对本发明的限制,有关技术领域的技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变换或变型,因此所有等同的技术方案,都落入本发明的保护范围。 |