技术领域
[0001] 本
发明提出一种设备缺陷率的检测方法,特别是一种基于数量置信度的设备缺陷 率检测方法。
背景技术
[0002] 在电
力设备运行评价、生产厂家产品
质量评价中,经常需要对设备的缺陷率进行 检测,所述的设备缺陷率的定义为:设备发生的缺陷总数除以设备总数与统计年数的乘积, 单位是项八百台.年)。
[0003]
现有技术中,对某一厂家设备的总体缺陷率检测而言,通常采用对各批次的设备 缺陷率取平均值的
算法。由于同一厂家各投运批次设备数之间可能存在较大差距,而设备 数不同的各个批次对该厂家的缺陷度的反映程度是存在差异的,所以检测结果会影响总体 缺陷率检测的精确性。
[0004] 以某省级
电网IlOkV主变台数前十名的生产厂家各投运批次的主变数量为例,如 表1所示:
[0005] 表IllOkV主变投运总数前十名设备厂家各投运批次设备数统计表
[0006]
[0007] 设备数量最多的批次其设备总数达到107台,而部分批次的设备数量仅有1台。由 此可见,同一厂家各投运批次设备数之间普遍存在较大差距。
发明内容
[0008] 本发明所要解决的技术问题,就是提供一种基于设备数量置信度的设备缺陷率检 测方法,其能更客观更恰当地检测厂家设备总体缺陷率,满足对设备质量的综合性评估。
[0009] 解决上述技术问题,本发明采用的技术方案如下:
[0010] 一种基于数量置信度的设备缺陷率检测方法,其特征是包括以下步骤:
[0011] 步骤Sl,计算设备个体缺陷率集合
[0012] 对于不同研宄对象,其设备缺陷率的分布特性均不一样,首先需要研宄设备个体 缺陷率的分布特性,以建立该研宄对象的总体缺陷率与个体缺陷率的关联关系;
[0013] 以单台设备的缺陷率为一个样本,单台设备的缺陷率计算公式如下:
[0014]
[0015] 其中,缺陷事件数量是指设备在整个观察周期出现的缺陷事件数;观察年数是指 设备参与缺陷观测记录的年数,观察年数的计算公式为:
[0016] 观察年数=观察结束年-观察开始年+1
[0017] 通过上述计算公式,得到与设备Di对应的缺陷率aP形成该研宄对象的设备个体 缺陷率集合I= {aiIi= 1,2, ..n},其中n为设备的序号;
[0018] 此外,计算该集合的均值、方差与标准差三个统计量。
[0019] 步骤S2,进行正态分布检验
[0020] 经研宄,在一般情况下,一批设备的个体缺陷率集合满足正态分布,这也是本算法 进行后续步骤的前提;因此,需要对步骤1求得的设备个体缺陷率集合进行正态分布检验;
[0021] 进行正态分布检验,有公式法与图像法两种方法:
[0022] (1)公式法
[0023]采用Kolmogorov-Smirnova(K-S)算法以及Shapiro-Wilk(S-W)算法进行正态分 布检验,观察其假设检验的显著性
水平;
[0024] 若显著性水平在0. 05以下,认为研宄对象服从正态分布;
[0025] (2)图像法
[0026] 采用Q-Q图来观察研宄样本是否服从正态分布,Q-Q图全称为Quantile-Quantile plot,是一种用于直观表示观察值与预测值差异的散点图;正态分布检验的Q-Q图,就是由 标准正态分布的分位数为横坐标,样本值为纵坐标的散点图;
[0027] 利用Q-Q图
鉴别样本数据是否近似于正态分布,需要观察Q-Q图上的点是否近似 地在一条直线附近;该直线是理想情况下样本数据如果满足正态分布所应该呈现的图像; 用Q-Q图还可获得样本偏度和峰度的粗略信息;
[0028] 若样本数据与所述直线对应点集合的方差分析通过置信水平为0. 95的双侧检 验,认为研宄对象服从正态分布;
[0029] 步骤S3,计算各设备数量的置信度
[0030] 在验证了研宄对象的设备个体缺陷率集合服从与正态分布之后,计算各设备数量 的置信度;
[0031] 置信度也称为可靠度,或置信水平、置信系数;在抽样对总体参数做出估计时,由 于样本的随机性,其结论总是不确定的;因此,采用数理统计中的区间估计法,在估计值与 总体参数在一定允许的误差范围以内,估计值落在相应区间的概率有多大,这个相应的概 率称作置信度;
[0032] 置信度是反映样本描述总体的可靠性程度的统计量,因此研宄不同数量的设备对 总体的反映程度,即关于不同的设备数量对应的置信度的研宄;
[0033] -般情况下,置信度是表明抽样指标和总体指标的误差不超过一定范围的概率保 证度,用F(t)来表示,在大样本(n>30)条件下,置信度F(t)是概率度t函数,概率度越大, 置信度越大;假设一定数量的设备的缺陷率反映总体缺陷率的准确性有95%的可靠性,这 个95 %就称为置信度(P),又称为置信水平;
[0034] 正态分布的置信度满足如下性质:
[0035] 若X1,X2,…,乂11是正态分布总体N(y,〇 2)的一个随机样本,贝U样本均值函数与 样本方差函数,满足如下性质:
[0038] 其中y为总体均值,S为总体的标准差;
[0039] 通过样本均值转化为标准的正态分布,首先确定置信度为a,使用双侧检验,
[0043] 对式子进行
整理,得到U的在置信度为a时候的置信区间为:
[0045]再确定误差d,误差为预估的总体均值与实际总体均值的偏差,则有:
[0049] 即n至少要满足n=Za/22*SVd2才能够满足该置信度和偏差的要求;
[0050] 因此,确定置信度a以及误差d,通过以下公式求得置信度与设备数量的对应关 系:
[0052] 通过查询正态分布表或EXCEL标准正态分布函数NORM.S.DIST(Za/2,TRUE),得到 Za/2对应的双侧置信度为a,进而求得单侧置信度b:
[0053]b= (a-0. 5) *2*100 %
[0054] b即为设备数量n对应的置信度;
[0055] 步骤S4,以设备数量置信度为权重进行缺陷率检测
[0056] 上述的计算过程明确指出设备数量越大,其反映总体情况能力越大;利用这一规 律,可根据不同批次的设备数量的差异对总体缺陷率作进一步修正,使对缺陷率的评价结 果更偏向于设备数量较大的批次的设备缺陷率,从而使检测结果更合理;
[0057] 对于数量不同的批次的总体缺陷率检测结果的修正,采用加权平均的方法,对设 备数量较大的批次的设备赋以更大的权重,使总体缺陷率检测值更接近于该批次的设备;
[0058] 实际计算中可知,统计结果的可信度与样本容量并不呈正线性关系,当样本量到 达一定的
阈值之后,样本量的增加对统计结果的可信度的影响是微小的;因此,适当的处理 方法是将相应台数设备的置信度作为权重,对设备厂家各批次的缺陷率进行加权平均,具 体的操作步骤如下:
[0059] -、分别计算某一生产厂家各批次的缺陷率DIi;
[0060] 二、利用该生产厂家各批次的设备数量计算相应的置信度,根据置信度的计算结 果,计算该生产厂家的缺陷率,其计算公式如下:
[0062] 其中,DI表示该生产厂家的总体缺陷率,DIi为该生产厂家批次i的缺陷率;其批 次对应的置信度为ai,对其进行加权平均得出该生产厂家的总体缺陷率检测结果。
[0063] 有益效果:本发明克服了传统缺陷率检测方法中,忽视设备各批次群体的数量差 异,简单地根据缺陷数量和设备数量相除而带来的不准确性,考虑了不同设备数量的群体 在缺陷率可信程度方面的差别,这在诸如生产厂家产品质量缺陷评价等工作中将提高评价 的公正性。
附图说明
[0064] 图1为缺陷率累积分布图;
[0065] 图2为缺陷率Q-Q图;
[0066] 图3为设备数量100以内的置信度曲线;
[0067] 图4为样本数为1至20的试验结果示意图;
[0068] 图5为数学模型计算结果与实验结果的对比示意图。
具体实施方式
[0069] 下面通过具体的
实施例,对本发明的技术方案作进一步的描述。
[0070] -种基于数量置信度的设备缺陷率检测方法,具体包括以下步骤:
[0071] 步骤Sl,计算设备个体缺陷率集合
[0072] 本发明实施例中,研宄对象为某省级电网所有主变在2007年至2012年的缺陷记 录。
[0073] 通过设备个体缺陷率计算公式:
[0074]
[0075] 得到该省级电网所有主变的个体缺陷率集合;
[0076] 其描述性统计量如下:
[0077] 表2缺陷率集合描述统计量
[0078]
[0079] 由表2可知,某省级电网所有设备总体缺陷率的均值为0. 347,方差为0. 299,标准 差为0. 547 ;该缺陷率集合是一个峰值左偏的分布,具体分布情况如图1所示,其中横轴为 单台设备缺陷率(单位:项八台•年)),纵轴为对应区间的设备数量。
[0080] 由图1可知,大部分的缺陷率数值分布0. 0-2. 0的之间,而大于2. 0的缺陷率数值 则非常少。经统计,数值大于2. 0的数据,只占总样本量的1. 7%。
[0081] 步骤S2,进行正态分布检验
[0082] 从图1可以发现,缺陷率的分布呈现为在缺陷率为0集中,随着缺陷率的增大,设 备数量逐渐递减的分布,与正态分布类似。利用SPSS对该缺陷率集合的分布进行正态检 验。
[0083] 表3正态性检验结果
[0084]
[0085] a.Lilliefors显著水平修正
[0086] 表3中,统计量为分别用表中所示的两种不同统计量,Kolmogorov-Smirnova(K-S) 统计量以及Shapiro-Wilk(S-W)统计量的具体数值;df表示样本数;sig表示假设检验的 显著性。
[0087] 由于K-S统计量适用于大样本的验证,所以我们观察K-S统计量的值,为0. 263,其 对应的Sig.值,为0. 000,意味着99. 9%的可信度可以认为总体样本是近似符合正态分布 的。
[0088] 观察利用总体样本描绘出的Q-Q图如图2。
[0089] 如图2所示,只有当缺陷率大于2. 0的时候,整个图像才开始逐渐偏离正态分布的 期望直线。由前面的分析可知,缺陷率大于2. 0的设备数量,只占总样本量的1. 7%。
[0090] 因此,无论是数学计算抑或是图像法,都证明了设备缺陷率总体是服从正态分布 的。
[0091] 步骤S3,计算各设备数量的置信度
[0092] 证明了设备总体缺陷率服从于正态分布之后,可利用正态分布置信度的计算方法 建立设备数量与置信度的关联。
[0093] 由SPSS的描述性统计可知总体的均值为0. 347,方差为0. 299,现取误差为均值的 10%,即为0. 0347,得到n与a所对应的函数:
[0095]如设备台数n= 16时,Za/2= 0. 2537,再通过查询正态分布表或EXCEL标准正态 分布函数NORM.S.DIST(0. 2537,TRUE),求得0. 2537对应的双侧置信度为0. 6002,进而求得 单侧置信度b= (0.6002-0. 5) *2*100 % = 20.04% ;
[0096] 经过计算,得出如下的设备数量与置信度的对应表:
[0097] 表4设备数量与置信度的对应关系
[0098]
[0099] 设备数量在100以内的置信度分布图如图3所示。
[0100] 置信度计算结果的检验
[0101] 对置信度的推理结果进行验证,可以根据伯努利大数定律,设计抽样实验对置信 度进行检验。
[0102] 伯努利大数定律,是指在试验不变的条件下,进行多次重复试验,随机事件发生的
频率会近似等于它的概率。当试验次数足够多时,可以用事件出现的频率来描述它的概率。
[0103] 以该省级电网4010台主变的缺陷率作为总体样本数据,设计随机抽样实验。根据 上述正态分布模型的数据,总体样本均值0. 347,标准差0. 547,采用误差为均值的10%,即 0. 0347进行随机抽样实验。每一次实验选择一个抽样容量,抽样容量从1开始,依此递增, 每次实验重复10万次,取实验平均数落在误差区间内的频率作为对应抽样容量的概率,即 置信度。最终实验结果如图4。
[0104] 将此实验的输出结果与通过正态分布模型得到的结果的置信度进行比较,两种方 法随设备数量变化,置信度的变化曲线在设备数量大于3之后几乎完全吻合,如图5所示, 进一步验证了利用正态分布计算置信度方法的正确性。
[0105] 步骤S4,以设备数量置信度为权重进行缺陷率检测
[0106] 得到各设备数量对应的置信度之后,可应用于设备缺陷率的检测环节中。计算出 各设备批次的缺陷率与设备数量之后,以设备数量对应的置信度值为权重进行加权平均, 得到最终的设备总体缺陷率,作为设备评价的参考指标之一。
[0107] 具体的操作步骤如下:
[0108] -、分别计算某一生产厂家各批次的缺陷率DIi;
[0109] 二、利用该生产厂家各批次的设备数量计算相应的置信度,根据置信度的计算结 果,计算该生产厂家的缺陷率,其计算公式如下:
[0111] 其中,DI表示该生产厂家的总体缺陷率,DIi为该生产厂家批次i的缺陷率;其批 次对应的置信度为ai,对其进行加权平均得出该生产厂家的总体缺陷率检测结果。
[0112] 通过以上方案可以看出,基于设备数量置信度进行缺陷率的检测,考虑了研宄对 象的实际个体缺陷率分布情况,并据此计算出不同设备数量对应的置信度,将之作为权重 来平衡各设备批次缺陷率对总体缺陷率的影响,提升了最终运算结果的精确性与客观性。 利用这一算法对电网生产数据进行分析挖掘,能够辅助企业把握电网生产运行的内在特 征,挖掘有效的知识,从而电网提高运行管理效率,辅助管理决策。