[0030] S54、令k=k-kdel,重复步骤S52至S54,直至确定最佳工况聚类。
[0031] 根据本发明的一些实施例,所述设备状态期望值计算,包括步骤:
[0032] 根据所述高斯混合模型gm计算得到的样本的标签矩阵IDX、以及样本按照高斯混合模型分布的联合概率密度自然对数值向量logpdf,求取各类样本点的联合概率密度自然对数值最大值,将所述各类样本点的联合概率密度自然对数值最大值所对应的样本点作为各类样本的期望值,组成k行P列期望值矩阵,其中,P为所述健康样本数据的样本变量个数。
[0033] 根据本发明的一些实施例,所述设备状态预警计算,包括步骤:
[0034] 采集设备的实时监测数据;
[0035] 根据所述高斯混合模型gm计算所述实时监测数据的联合概率密度自然对数值logpdfx以及所述期望值矩阵的联合概率密度自然对数值logpdfest(l);
[0036] 若logpdfx>logpdfest(l),则设备的健康度h=100%,若logpdfx≤logpdfest(l),则设备的健康度h满足:
[0037]
[0038] 若健康度h小于设定限值hmin时,则发出预警
信号。
[0039] 根据本发明的一些实施例,所述设备状态影响参数排序,包括步骤:
[0040] 根据所述实时监测数据和所述期望值矩阵的对应向量之间的曼哈顿距离,计算所述实时监测数据中的各个监测参数偏离期望值对于设备状态的影响量;
[0041] 根据各个监测参数的影响量进行降序排序。
[0042] 根据本发明实施例的一种电站设备状态智能评价和预警装置,包括:
[0043] 历史数据采集组件、统计特征量计算组件、数据标准化组件、K值选择组件、高斯混合模型算法组件、设备状态期望值计算组件、设备状态预警计算组件以及设备状态影响参数排序组件;
[0044] 所述历史数据采集组件用于采集设备健康样本数据;
[0045] 所述统计特征量计算组件以及所述数据标准化组件用于健康样本数据预处理;
[0046] 所述K值选择组件用于计算聚类个数的合适值;
[0047] 所述高斯混合模型算法组件用于搭建最佳高斯混合模型;
[0048] 所述设备状态期望值计算组件用于设备状态期望值计算;
[0049] 所述设备状态预警计算组件用于设备状态预警计算;
[0050] 所述设备状态影响参数排序组件用于设备状态影响参数排序。
[0051] 根据本发明实施例的一种电站设备状态智能评价和预警系统,包括:
存储器、处理器及存储在存储器上并可在处理器上运行的
计算机程序,所述处理器执行所述计算机程序时实现如上述的一种电站设备状态智能评价和预警方法。
[0052] 相对于现有技术,本发明实施例披露的技术方案具有以下有益效果:
[0053] 本公开基于
大数据分析平台实现了电站设备健康状态样本自动筛选,且高斯混合模型的
聚类分析方法搭建了设备状态实时评估与预警模型,改变了定性状态评估的主观性,提升设备状态监测的及时性、有效性和智能性。相比于支持向量机、神经网络等数据挖掘算法在进行设备状态评估时依赖多维空间点的距离评价机制,基于高斯混合模型的概率密度函数进行设备状态评价有效降低了设备预警的误报率。
[0054] 本公开实施例所实现的更多特点和优势,将在具体实施方式或实践中给出。
附图说明
[0055] 下面结合附图和实施例对本发明进一步地说明;
[0056] 图1为本发明实施例提供的一种电站设备状态智能评价和预警方法的流程示意图;
[0057] 图2为本发明实施例提供的聚类评价系数随聚类个数的变化曲线的示意图;
[0058] 图3为本发明实施例提供的一种电站设备状态智能评价和预警装置的示意图。
具体实施方式
[0059] 下面将结合附图,对本公开实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。需要说明的是,在不冲突的情况下,本公开实施例及实施例中的特征可以相互组合。另外,附图的作用在于用图形补充
说明书文字部分的描述,使人能够直观地、形象地理解本公开的每个技术特征和整体技术方案,但其不能理解为对本公开保护范围的限制。
[0060] 参照图1,本发明的一个实施例,提供了一种电站设备状态智能评价和预警方法,本方法可以基于一体化大数据分析平台而实现,包括以下步骤:
[0061] S100、筛选设备监测参数;
[0062] 依据设备的监测要求和监测目标确定模型的输入参数,即,确定设备实时监测参数,例如:介质
温度、压力、流量、
轴承振动等。
[0063] S200、采集设备健康样本数据;
[0064] 本步骤可以基于大数据平台的历史数据采集组件而实现。
[0065] 自动计算出设备健康样本时间段,并基于健康样本时间段进行设备健康样本数据批量采集。可以选择设备在异动之后的时间段进行样本数据采集,避开设备缺陷过程时间段及前后1-2天、检修时间段及前后1-2天,另外,采集
频率依据样本量规模可以设置为30秒-10分钟不等,以保证所有参数采集的同时性和连续性。
[0066] 采集的设备健康样本数据具体为:可从一体化大数据平台集成电站管理信息系统的关系
数据库中,读取监测设备的设备台账信息包括设备缺陷台账、检修台账、异动台账等,获取监测设备的缺陷录入时间、缺陷验收时间、检修开始时间、检修结束时间、设备异动时间等。
[0067] S300、健康样本数据预处理;
[0068] 本步骤可以基于大数据平台的统计特征量计算组件和大数据平台的数据标准化组件而实现。
[0069] 在步骤S200采集完健康样本数据后,此时,确定健康样本数据为S0,S0为n行p列的矩阵,其中,n代表样本记录个数,p代表样本变量个数。
[0070] 作为一种可实施方式,预处理的具体过程如下:计算样本数据的统计特征值,包括但不仅限于:均值向量(avg1,avg2,…,avgp)、最大值向量(max1,max2,…,maxp)、最小值向量(min1,min2,…,minp)、极差向量(span1,span2,…,spanp)、标准差向量(std1,std2,…,stdp)、以及泊松相关系数矩阵Corre;
[0071] 根据泊松相关系数矩阵Corre的各元素的值识别冗余监测参数,根据样本的极差向量、标准差向量识别异常数据,最终确定用于模型计算的样本矩阵S,矩阵维度为N行P列,N代表样本记录个数,P代表样本变量个数。
[0072] 根据式:((si-avgi)/stdi)对样本矩阵S进行归一化处理,其中si代表某一个监测参数的数值。
[0073] S400、计算聚类个数的合适值;
[0074] 本步骤可以基于大数据平台的K值选择组件而实现。
[0075] 对归一化处理后的样本进行聚类计算以及聚类评价系数计算,首先,定义聚类评价系数coeff,coeff定义为样本分为k类的类内距离之和(sum_dk)与样本分为1类的类内距离(sum_d1)之和的比值,即:
[0076] coeff=sum_dk/sum_d1
[0077]
[0078]
[0079] 在上式中,Mulj表示为样本分为l类时,某一类样本的均值向量第j列;avgj表示样本总体的均值向量的第j列;nl表示样本分为k类时,某一类样本的样本数;这里,设定k值的变化范围不小于1,且不大于样本记录个数的均方根 即
[0080] 根据K均值算法(K-means)进行聚类计算以及聚类评价系数计算,并绘制出聚类评价系数随聚类个数变化的曲线,观察曲线的陡降至平缓变化的中间点即拐点处,由此确定拐点对应的聚类个数的估计值ks,如图2所示,图2为一条聚类评价系数随聚类个数的变化曲线,其中横坐标为聚类个数,纵坐标为聚类评价系数。
[0081] S500、搭建最佳高斯混合模型;
[0082] 本步骤可以基于大数据平台的高斯混合模型算法组件而实现。
[0083] 设置聚类个数k的初始估计值为ks;
[0084] 基于EM算法(Expectation-Maximization algorithm,最大期望算法)对归一化样本求取高斯混合模型gm,并进一步能够计算得到高斯混合模型的均值矩阵gm.Mu、各个高斯模型的权值向量gm.PComponents、样本的标签矩阵IDX、以及样本按照高斯混合模型分布的联合概率密度自然对数值向量logpdf;
[0085] 计算得到各类包含样本记录个数,令为numi(i=1,2,..,k),判断各个分类的numi值是否小于N/(10*k),或者权值gm.PComponentsi是否小于1/(10*k),记录满足上述两个判断条件的分类个数kdel。
[0086] 令聚类个数k=k-kdel,计算基于高斯混合模型的聚类分析结果,重复上述判断,反复调整聚类个数,实现符合上述聚类要求的聚类结果。
[0087] S600、设备状态期望值计算;
[0088] 本步骤可以基于大数据平台的设备状态期望值计算组件而实现。
[0089] 根据上述步骤S500中的高斯混合模型gm,计算得到的标签矩阵IDX、以及样本按照高斯混合模型分布的联合概率密度自然对数值向量logpdf,求取各类样本点的联合概率密度自然对数值最大值,形成k个元素的列向量logpdfest,并将各类样本点的联合概率密度自然对数值最大值所对应的样本点作为各类样本的期望值,即:k行P列的期望值矩阵EST。
[0090] S700、设备状态预警计算
[0091] 本步骤可以基于大数据平台的设备状态预警计算组件而实现。
[0092] 实时采集设备的一组监测数据,即P维向量[X]1*P,其中P代表样本变量个数,基于高斯混合模型gm计算其所属类别l及向量[X]1*P的联合概率密度自然对数值logpdfx,向量logpdfest第l个元素即为期望值的概率密度对数值logpdfest(1),期望值矩阵EST的第l行即为监测数据的期望值[Xest]1*P。
[0093] 当实时监测数据的联合概率密度自然对数值logpdfx大于期望值的相应值logpdfest(1)时,健康度h定义为100%,当实时监测数据的联合概率密度自然对数值小于实时期望值的相应值时,健康度h计算公式如下:
[0094]
[0095] 若计算结果中,健康度h小于设定限值hmin时,则可给出设备状态监测预警。需要说明的是,hmin值可以根据实际情况进行设定。
[0096] S800、设备状态影响参数排序;
[0097] 本步骤可以基于大数据平台的设备状态影响参数排序组件而实现。
[0098] 基于上述设备监测数据,即监测向量[X]1*P,与期望值向量[Xest]1*P的曼哈顿距离,进行设备各个监测参数偏离期望值对于设备状态的影响量计算。
[0099] 归一化设备监测向量及其期望值,得到设备监测向量(x1,x2,…,xP)与期望值向量(xest1,xest2,…,xestP)。某一个监测参数偏离期望值的对于设备状态的影响量fraci的计算公式如下:
[0100]
[0101] 由上式可知,某监测参数的设备状态的影响量fraci越大,说明该参数异常对设备状态预警贡献程度越大。当产生设备状态预警时,对设备状态影响量计算结果按照降序排列,从而重点关注排序在前列的设备监测参数值及趋势,为设备状态诊断提供数据依据。
[0102] 本发明实施例提供的一种电站设备状态智能评价和预警方法,能够基于大数据分析平台,实现电站设备健康状态样本自动筛选,且高斯混合模型的聚类分析方法搭建了设备状态实时评估与预警模型,改变了定性状态评估的主观性,提升设备状态监测的及时性、有效性和智能性。相比于支持向量机、神经网络等数据挖掘算法在进行设备状态评估时依赖多维空间点的距离评价机制,基于高斯混合模型的概率密度函数进行设备状态评价有效降低了设备预警的误报率。
[0103] 参照图3,本发明的另一个实施例,提供了一种电站设备状态智能评价和预警装置,包括:
[0104] 历史数据采集组件、统计特征量计算组件、数据标准化组件、K值选择组件、高斯混合模型算法组件、设备状态期望值计算组件、设备状态预警计算组件以及设备状态影响参数排序组件;
[0105] 历史数据采集组件用于采集设备健康样本数据;
[0106] 统计特征量计算组件、以及数据标准化组件用于健康样本数据预处理;
[0107] K值选择组件用于计算聚类个数的合适值;
[0108] 高斯混合模型算法组件用于搭建最佳高斯混合模型;
[0109] 设备状态期望值计算组件用于设备状态期望值计算;
[0110] 设备状态预警计算组件用于设备状态预警计算;
[0111] 设备状态影响参数排序组件用于设备状态影响参数排序。
[0112] 需要说明的是,由于本实施例中的电站设备状态智能评价和预警装置与上述的电站设备状态智能评价和预警方法基于相同的发明构思,因此,方法实施例中的相应内容同样适用于本装置实施例,此处不再详述。
[0113] 本发明的另一个实施例,还提供了一种电站设备状态智能评价和预警系统,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述实施例所述的一种电站设备状态智能评价和预警方法。
[0114] 需要说明的是,由于本实施例中的电站设备状态智能评价和预警系统与上述的电站设备状态智能评价和预警方法以及装置基于相同的发明构思,因此,方法以及装置的实施例中的相应内容同样适用于本系统实施例,此处不再详述。
[0115] 为了方便本领域技术人员理解,本发明的另一实施例,还提供了一种电站设备状态智能评价和预警方法,该方法基于大数据平台进行
汽轮机转轴状态监测模型搭建,具体步骤如下:
[0116] 步骤1、筛选设备监测参数;
[0117] 依据汽轮机转轴状态监测要求初步确定模型的监测参数有82个,包括有轴振、瓦振、轴温、缸温、轴位移、偏心、汽缸膨胀、
轴封蒸汽温度、以及
润滑油温等等。
[0118] 步骤2、采集设备健康样本数据;
[0119] 从一体化大数据平台集成电站管理信息系统的关系数据库,读取监测设备的设备台账信息包括设备缺陷台账、检修台账、异动台账等,获取监测设备的缺陷录入时间、缺陷验收时间、检修开始时间、检修结束时间、设备异动时间等。
[0120] 选择设备异动之后的时间段进行样本数据采集,同时避开设备缺陷过程时间段及前后2天、检修时间段及前后2天,系统自动计算出设备健康样本时间段,并基于健康样本时间段进行设备健康样本数据批量采集,采集频率设置为5分钟,采集过程保证所有监测参数采集的同时性和连续性。
[0121] 最后,基于大数据平台的数据采集组件采集得到4000行*82列的样本数据。
[0122] 步骤3、样本数据预处理;
[0123] 基于上述实施例所述的样本数据预处理方法,基于大数据平台进行样本数据预处理各类组件开发和建模:
[0124] 基于统计特征分析组件进行样本数据统计特征值计算,基于异常值筛选、空值填补组件进行样本异常值识别和处理,基于相关性分析组件进行线性相关变量筛选,删除冗余变量,基于数据标准化组件进行样本数据归一化处理,最终,确定的健康样本数据为3855行*46列。
[0125] 步骤4、计算聚类个数的合适值;
[0126] 基于上述实施例所述的K均值聚类个数确定方法,在大数据平台进行k值选择组件开发和建模,求得聚类评价系数变化曲线如上述图2所示,确定聚类个数合适值ks等于40。
[0127] 步骤5、搭建最佳高斯混合模型;
[0128] 设置聚类个数为k,选择大数据平台的高斯混合模型算法组件,进行最佳高斯混合模型计算,确定最佳聚类个数为30,并保存此最佳高斯混合模型,包括均值矩阵gm.Mu、权值向量gm.PComponents、样本的标签矩阵IDX、以及样本按照高斯混合模型分布的联合概率密度自然对数值向量logpdf。
[0129] 步骤6、设备状态期望值计算;
[0130] 基于上述实施例所述的K均值聚类个数确定方法,选择大数据平台的设备状态期望值计算组件,计算得到各类样本的期望值,得到k行P列期望值矩阵EST。
[0131] 步骤7、设备状态预警计算;
[0132] 基于上述实施例所述的设备状态预警计算方法,选择大数据平台的设备状态预警计算组件,针对设备实时监测工况数据进行设备状态期望值和状态值计算。
[0133] 步骤8、设备状态影响参数排序;
[0134] 选择大数据平台的设备状态影响参数排序组件,计算得到各个监测参数的设备状态的影响量fraci。
[0135] 本实施例提供的一种电站设备状态智能评价和预警方法,实现设备健康状态样本自动筛选、设备状态实时评估与预警,改变了定性状态评估的主观性,提升设备状态监测的及时性、有效性和智能性。
[0136] 上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所述技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。