基于案例推理的钢板表面缺陷的自动识别方法专利检索-缺陷形式要求受理局第I章专利合作条约专利权专利检索查询-专利查询网

基于案例推理的 钢板表面 缺陷的自动识别方法

阅读：553发布：2023-02-11

专利汇可以提供基于案例推理的钢板表面缺陷的自动识别方法专利检索，专利查询，专利分析的服务。并且由于识别钢板表面缺陷的机理模型难以建立，不利于产品质量的检测与控制，本发明提出一种基于案例推理技术的钢板表面缺陷的识别方法，实现对裂纹、鳞皮、结疤、凸起等七种缺陷的自动识别；该方法通过建立案例库、权重分配、获取目标案例、数值归一化、案例检索、案例重用及案例存储等环节建立案例推理识别模型，并实现识别算法，从而提高识别的准确率；解决了当前分配案例推理特征变量权重的主观性和不确定性而导致识别准确率低的问题；实验结果表明该方法能够准确识别钢板表面的缺陷，具备良好的灵敏性和特异性，提高钢板表面缺陷的处理效率和降低废品率，对钢板生产期间表面缺陷的成因分析、改进生产操作方法、提高产品质量具有重要意义。，下面是基于案例推理的钢板表面缺陷的自动识别方法专利的具体信息内容。

权利要求

1.基于案例推理的钢板表面缺陷的自动识别方法，其特征在于包括以下步骤：
步骤1：建立案例库；将从生产现场获得的历史数据表示成（钢板缺陷问题描述；钢板缺陷种类）的序偶形式，并存储于案例库中，钢板缺陷问题描述共有27个特征变量，分别用x1,…,x27表示，这27个特征变量包括X最小值、X最大值、Y最小值、Y最大值、像素区域、X周长、Y周长、光度和、最小光度、最大光度、输送辊道长度、钢种(A300)、钢种(A400)、钢板厚度、边缘指数、空指数、平方指数、外部X指数、边缘X指数、边缘Y指数、外部全局指数、面积记录、X指数记录、Y指数记录、取向指数、光度指数和S状弯曲面积，钢板缺陷种类共7类，包括裂纹、Z刮伤、K刮伤、鳞皮、结疤、凸起或其它；其中第k个历史数据构成的源案例表示为
Ck=(Xk;Yk),k=1,2,…,p
其中，p是源案例总数；Xk=(x1,k,…,xi,k,…,x27,k)是第k个源案例的问题描述，xi,k(i=1,2,…,27)表示第k个源案例问题描述中的第i个特征变量的数值，Yk是第k个源案例中的缺陷种类；
步骤2：确定各个特征变量的权重；采用遗传算法(genetic algorithms,GA)对权重进行迭代训练后分配，具体为：
(1)获取训练案例；设定训练权重的案例数量q，记为Ck'=(Xk';Yk'),k'=1,2,…,q；
(2)将训练案例问题描述Xk'中的每一个特征变量的数值进行归一化处理，归一化后每个训练案例可表示为 k′=1，2，…，q，其中的
(3)参数初始化；设定特征变量初始权重组合的组数m>1、迭代次数Iter>1、交叉概率Pc∈(0,1)、变异概率Pmu∈(0,1)以及对每一个权重进行二进制编码的位数n，然后随机产生由m组以n位二进制编码表示的特征变量权重组合组成的初始权重矩阵，如下矩阵形式：
其中，Gj是以二进制码表示的第j组权重组合，Gj,i表示第j组权重组合Gj中第i个特征变量xi的二进制码权重，表示Gj,i中的第l位数据；
(4)对权重矩阵中的每一组二进制码权重组合进行十进制解码，得到以十进制表示的权重矩阵D，然后经过映射变换得到映射变换后的权重矩阵Ω，所述的权重矩阵D如下所示：
其中，Dj是以十进制表示的第j组权重组合，Dj,i是十进制解码；所述的权重矩阵Ω如下所示：
其中，Ωj是映射变换后的第j组权重组合，ωj,i∈[0,1]是第j组权重组合中特征变量xi的权重；
(5)计算相似度；将上步中得到的解码后的m组权重组合Ω1～Ωm分别用q个训练案例并采用留一法进行训练，计算得到每组权重组合的q-1个相
似度；
(6)利用相似度，依次计算权重组合Ω1～Ωm分别作用时的正确匹配次数
qj′(j=1,2,…,m)；
(7)利用正确匹配次数qj′，依次计算权重组合Ω1～Ωm分别作用时的准确率Fj(j=1,2,…,m)，并记录本次迭代的最高准确率max(F1,F2,…,Fm)；
(8)利用准确率Fj，依次计算权重组合Ω1～Ωm被选择的概率，然后根据权重组合Ω1～Ωm被选择的概率，采用轮盘赌法得到选择操作后的二进制码权重矩阵G'=[G1' … Gj' … G'm]T，其中，T表示矩阵转置，G'j是Gj经过选择操作后的第j组二进制码权重组合；
(9)交叉：将上步选择后的权重矩阵G'中的m个权重组合从第一个开始，两两配对交叉，m是奇数时，最后一权重组合不参与交叉，具体为：比较设定的交叉概率Pc∈(0,1)和随机产生的实数rpc∈(0,1)大小关系，如果随机数rpc小于Pc，则产生一个随机整数Cpoint∈(0,27n)，以此整数为分界点将两两配对的权重组合分别分为左右两部分，右边不含分界点处的二进制数，然后将它们的右边部分互相交换；否则，保持原来的值不变，重复此过程，一直到所有权重组合均执行上述操作，从而形成交叉后的权重矩阵，如下式所示：
其中，G″j是G'j经过交叉操作后的第j组二进制码权重组合，G″j,i表示第j组权重组合G″j中第i个特征变量xi的二进制码权重；
(10)变异：根据设定的变异概率Pmu∈(0,1)，对上步交叉后的权重矩阵中的每一个二进制位产生一个随机数rpm∈(0,1)，如果随机数rpm小于Pmu，则将该二进制位取反；否则，保持原来的值不变，从而形成变异后的权重矩阵，如下式所示：
其中，G′″j是G′″j经过变异操作后的第j组二进制码权重组合，G′″j,i表示第j组权重组合G′″j中第i个特征变量xi的二进制码权重；
(11)获取权重；若未达到设定的迭代次数Iter，则针对上步变异后的权重矩阵，重复上述的步骤(4)～步骤(10)，直至达到设定的迭代次数Iter时为止，此时，将每次迭代过程中步骤(7)记录的最高准确率max(F1,F2,…,Fm)按降序排列，处于第1位的准确率所对应的那一组权重即为所求，记为ω1～ω27，从而完成通过GA迭代训练后分配权重的过程；
步骤3：获取目标案例；记目标案例的问题描述数据是Xp+1=(x1,p+1,…,xi,p+1,…,x27,p+1)，待识别的结果记为Yp+1；
步骤4：数值归一化；将源案例问题描述Xk=(x1,k,…,xi,k,…,x27,k)，k=1,2,…,p和目标案例问题描述Xp+1=(x1,p+1,…,xi,p+1,…,x27,p+1)中的特征变量的数值进行归一化处理，如下式所示：
i=1,2,…,27;k=1,2,…,p
i=1,2,…,27
其中，为归一化后第k个源案例的问题描述中第i个特征变量的数值；为归一化后目标案例的问题描述中第i个特征变量的数值；
步骤5：案例检索；根据目标案例问题描述与源案例问题描述中归一化后的各个钢板缺陷特征变量的数值以及获得的权重ω1～ω27，计算各源案例与目标案例的相似度sk：
k=1，2，…p
可以得到p个相似度，分别是s1～sp；
步骤6：案例重用；取出s1～sp中的最大相似度，它对应的源案例的缺陷种类即为目标案例的识别结果Yp+1：
步骤7：案例存储；将目标案例的识别结果Yp+1及归一化前的目标案例问题描述Xp+1=(x1,p+1,…,xi,p+1,…,x27,p+1)组成新的源案例存储于案例库中，源案例总数p增1，实现案例库的增量式学习过程。
2.根据权利要求1所述的基于案例推理的钢板表面缺陷的自动识别方法，其特征在于：步骤2（2）中所述的归一化的计算公式如下：
,i=1,2,…,27;k'=1,2,…,q。
3.根据权利要求1所述的基于案例推理的钢板表面缺陷的自动识别方法，其特征在于：步骤2（4）中所述的解码公式如下：
i=1,2,…,5;j=1,2,…,m。
4.根据权利要求1所述的基于案例推理的钢板表面缺陷的自动识别方法，其特征在于：步骤2（4）中所述的映射变换具体为：根据Dj,i的值，将每个特征变量xi的权重值映射至区间[0,1]，映射公式如下：
i=1,2,…,5;j=1,2,…,m。
5.根据权利要求1所述的基于案例推理的钢板表面缺陷的自动识别方法，其特征在于：步骤2（5）中所述的留一法进行训练，具体为：从q个训练案例中取出任一个作为目标案例，记为其中剩下的q-1个作为新的源案例，记为
k″=1,2,…,q-1，其中计算权重组合Ω1～
Ωm分别作用时目标案例的问题描述与q-1个源案例问题描述的相似度，其中第j组权重组合Ωj作用时，相似度sj,k″的计算公式如下：
k″=1,2,…,q-1。
6.根据权利要求5所述的基于案例推理的钢板表面缺陷的自动识别方法，其特征在于，步骤2（6）中所述的正确匹配次数的计算方法为：取权重组合的q-1个相似度中的最大值，该最大值对应的源案例的缺陷种类即为目标案例的匹配结果，遍历q个训练案例，得到q个匹配结果，将匹配结果与正确的缺陷种类比对，并记录正确匹配的次数qj′(j=1，…，m)。
7.根据权利要求1所述的基于案例推理的钢板表面缺陷的自动识别方法，其特征在于，步骤2（7）中所述的每个权重组合作用时的准确率Fj的计算公式如下：
Fj=qj′/q,j=1,2,…,m
其中qj′表示第j组权重组合Ωj作用时的正确匹配次数。
8.根据权利要求1所述的基于案例推理的钢板表面缺陷的自动识别方法，其特征在于：步骤2（8）中所述的权重组合Ωj被选择的概率Pj的计算公式如下：
j=1,2,…,m
其中，Fj表示Ωj作用时的准确率。
9.根据权利要求1所述的基于案例推理的钢板表面缺陷的自动识别方法，其特征在于：步骤2（8）中所述的采用轮盘赌法得到更新后的二进制码权重矩阵G'=[G1' …Gj' … T
G'm]，更新方法包括：首先按下式计算出权重组合Ωj被选择的累加概率ΣPj：
j=1,2,…,m
然后随机产生m个位于区间(0,1)中的实数，并按升序排列成r1，…，rj，…，rm，最后从r1开始，从左至右依次判断r1<ΣP1，…，r1<ΣPj，…，r1<ΣPm是否成立，假设第一个不等式成立的顺序号是j，则第j个被选择的累加概率对应的二进制码权重组合即为G1'，G'2的更新则从第j个累加概率开始，即判断r2<ΣPj，…，r2<ΣPm是否成立，如同G1'的形成方法可得到G'2，以此类推，直至得到G'm，从而得到更新后的二进制码权重矩阵G'。

说明书全文

基于案例推理的钢板表面 缺陷的自动识别方法

技术领域

[0001] 本发明利用人工智能领域的案例推理技术实现钢板表面缺陷的种类识别，不同种类的表面缺陷决定了钢板的等级划分，对缺陷的识别与分类可以为成因分析、改进操作方法提供积极的指导作用。钢板是冶金行业生产的重要产品之一，对其表面缺陷的识别与分类是生产过程中的一个重要环节，既属于人工智能领域，又属于冶金生产领域。

背景技术

[0002] 随着国民经济的增长和产品质量意识的增强，冶金行业自动化技术迎来了前所未有的发展机遇。国家中长期科技发展规划中提出要在制造业中研究并推广应用绿色化、数字化、智能化新技术。因此，本发明的研究成果具有广阔的应用前景。

[0003] 钢板是用钢水浇注、冷却后压制而成的平板状钢材，按厚度可分为薄板、中板、厚板等几种形式，其用途十分广泛，比如桥梁、造船、装甲、汽车等。钢板表面产生局部物理或化学性质不均匀的区域后形成表面缺陷，常常成为金属腐蚀的始发处。通常来说，表面缺陷的种类表现在裂纹、结疤、划伤等情形。由于表面缺陷可能导致最终产品使用性能的急剧下降，因此，钢板生产期间的表面质量监测及缺陷种类识别对成因分析、改进操作方法、提高产品质量具有重要意义。

[0004] 近十年来，机器视觉、模式识别得到长足的发展，利用这些技术识别产品的表面缺陷得到了广泛关注。机器视觉检测系统采用专用照相机将被检测的目标转换成图像信号，传送给图像处理系统，根据像素分布、亮度、颜色等信息，转变成数字信号，图像处理系统对这些数字信号进行处理和运算后，提取其特征信息，如面积、数量、位置、长度等，再根据制定的方法输出检测结果，从而实现自动识别功能。在机器视觉系统中，识别的准确性和实时性受到照明设备的稳定程度、照像机的分辨率、图像处理技术等因素的影响，往往不能取得理想的识别效果。另外，从钢板本身的技术参数来看，一些特征变量与缺陷种类之间存在一种非线性关系，难以建立特征变量与缺陷种类之间的精确机理模型。这些因素的存在给钢板表面缺陷的识别带来了不利影响，必须寻求新的处理方法，以满足冶金行业生产过程的需要。准确识别钢板表面的缺陷是等级划分、成因分析、改进操作方法的关键。此外，通过先进的识别方法，可以提高钢板生产过程的自动化水平，还可以有效地减少运行管理和操作人员，降低设备的运行费用。

[0005] 本发明设计了一种基于案例推理技术的钢板表面缺陷的识别方法，实现对裂纹、Z刮伤、K刮伤、鳞皮、结疤、凸起、其它等缺陷种类的自动识别。

发明内容

[0006] 本发明获得一种钢板表面缺陷的自动识别方法，该方法采用案例推理技术，通过建立案例库、权重分配、案例检索、案例重用及案例存储等环节建立案例推理识别模型，并实现识别算法；解决了当前分配案例推理特征变量权重的主观性和不确定性而导致识别准确率低的问题，通过特征变量的数值变化情况去识别缺陷种类；提高了钢板表面缺陷的处理效率，为缺陷的成因分析、改进生产操作方法、提高产品质量具有积极的指导意义。

[0007] 本发明采用了如下的技术方案及实现步骤：

[0008] 1.一种基于案例推理的钢板表面缺陷的自动识别方法，其特征在于包括以下步骤：

[0009] 步骤1：为了根据以往识别钢板表面缺陷的特征数值去识别新的特征数值所包含的缺陷种类，建立识别案例库；将从生产现场获得的历史数据表示成（钢板缺陷问题描述；钢板缺陷种类）的序偶形式，并存储于案例库中，钢板缺陷问题描述共有27个特征变量，分别用x1,…,x27表示，这27个特征变量包括X最小值、X最大值、Y最小值、Y最大值、像素区域、X周长、Y周长、光度和、最小光度、最大光度、输送辊道长度、钢种(A300)、钢种(A400)、钢板厚度、边缘指数、空指数、平方指数、外部X指数、边缘X指数、边缘Y指数、外部全局指数、面积记录、X指数记录、Y指数记录、取向指数、光度指数和S状弯曲面积，钢板缺陷种类共7类，包括裂纹、Z刮伤、K刮伤、鳞皮、结疤、凸起或其它；其中第k个历史数据构成的源案例表示为

[0010] Ck＝(Xk;Yk),k＝1,2,…，p

[0011] 其中，p是源案例总数；Xk=(x1,k,…,xi,k,…,x27,k)是第k个源案例的问题描述，xi,k(i=1,2,…,27)表示第k个源案例问题描述中的第i个特征变量的数值，Yk是第k个源案例中的缺陷种类；

[0012] 步骤2：为了客观计算目标案例与源案例之间的相似度，需确定各个特征变量的权重；采用遗传算法(genetic algorithms,GA)对权重进行迭代训练后分配，具体为：

[0013] (1)获取训练案例；设定训练权重的案例数量q，记为Ck'＝(Xk';Yk'),k'＝1,2,…，q；

[0014] (2)为了消除不同特征变量的量纲影响，将特征变量的数值归一化；将训练案例问题描述Xk'中的每一个特征变量的数值进行归一化处理，如下式所示：

[0015] i=1，2，…，27;k'=1，2，…，q

[0016] 归一化后每个训练案例可表示为 2,…,q，其中的

[0017]

[0018] (3)对GA训练权重的算法参数初始化；设定特征变量初始权重组合的组数m>1、迭代次数Iter>1、交叉概率Pc∈(0,1)、变异概率Pmu∈(0,1)以及对每一个权重进行二进制编码的位数n，然后随机产生由m组以n位二进制编码表示的特征变量权重组合组成的初始权重矩阵，如下矩阵形式：

[0019]

[0020] 其中，Gj是以二进制码表示的第j组权重组合，Gj,i表示第j组权重组合Gj中第i个特征变量xi的二进制码权重，表示Gj,i中的第l位数据；

[0021] (4)为了方便评估GA对权重的分配效果，须将二进制编码的权重解码；对权重矩阵中的每一组二进制码权重组合进行十进制解码，其中第j组二进制码权重组合中的第i个特征变量xi的二进制码权重的解码公式如下：

[0022] i＝1,2,…，27;j＝1,2,…,m

[0023] 其中，Dj,i是十进制解码。从而得到以十进制表示的权重矩阵D，如下所示：

[0024]

[0025] 其中，Dj是以十进制表示的第j组权重组合。然后根据Dj,i的值，将特征变量xi的权重值映射至区间[0,1]：

[0026]

[0027] 其中，ωj,i∈[0,1]是特征变量xi的权重。从而得到映射变换后的权重矩阵Ω，如下所示：

[0028]

[0029] 其中，Ωj是第j组权重组合；

[0030] (5)为了从案例库中获得相似案例去识别目标案例问题描述的缺陷种类，计算相似度；将上步中得到的解码后的m组权重组合Ω1～Ωm分别用q个训练案例采用留一法进行训练，

[0031] (6)利用相似度，依次计算权重组合Ω1～Ωm分别作用时的正确匹配次数，其中，第j组权重组合Ωj作用时，正确匹配次数的计算方法是：取sj,1～sj,q-1中的最大值，该最大值对应的源案例的缺陷种类即为目标案例的匹配结果，如此反复进行q次，得到q个匹配结果后，将匹配结果与正确的缺陷种类比对，并记录正确匹配的次数qj′(j＝1,2,…,m)；

[0032] (7)利用正确匹配次数qj′，依次计算权重组合Ω1～Ωm分别作用时的准确率，作为GA对权重进行迭代寻优的评价函数，其中Ωj作用时的准确率Fj如下式计算：

[0033] Fj＝qj′/q,j＝1,2,…,m

[0034] 并记录本次迭代的最高准确率max(F1,F2,…,Fm)；

[0035] (8)利用准确率Fj，依次计算权重组合Ω1～Ωm被选择的概率，其中Ωj被选择的概率Pj如下式计算：

[0036]

[0037] 从而得到Ω1～Ωm被选择的概率P1～Pm，概率越大的权重组合表示其对应的准确率越高，被选择的几率就大。采用轮盘赌法得到更新后的二进制码权重矩阵G'=[G1' … TG'j … G'm]，其中，G'j是Gj经过选择操作后的第j组二进制码权重组合，T表示矩阵转置。
更新方法包括：首先按下式计算出权重组合Ωj被选择的累加概率ΣPj：

[0038] j＝1,2,,m…

[0039] 然后随机产生m个位于区间(0,1)中的实数，并按升序排列成r1，…，rj，…，rm，最后从r1开始，从左至右依次判断r1<ΣP1，…，r1<ΣPj，…，r1<ΣPm是否成立，假设第一个不等式成立的顺序号是j，则第j个被选择的累加概率对应的二进制码权重组合即为G1'，G'2的更新则从第j个累加概率开始，即判断r2<ΣPj，…，r2<ΣPm是否成立，如同G1'的形成方法可得到G'2，以此类推，直至得到G'm，从而得到更新后的二进制码权重矩阵G'；

[0040] (9)为了实现GA对所有权重组合的全局搜索能力，执行相邻权重组合的部分交叉：将上步选择后的权重矩阵G'中的m个权重组合从第一个开始，两两配对交叉，m是奇数时，最后一权重组合不参与交叉。具体为：比较设定的交叉概率Pc∈(0,1)和随机产生的实数rpc∈(0,1)大小关系，如果随机数rpc小于Pc，则产生一个随机整数Cpoint∈(0,27n)，以此整数为分界点将两两配对的权重组合分别分为左右两部分，右边不含分界点处的二进制数，然后将它们的右边部分互相交换；否则，保持原来的值不变，重复此过程，一直到所有权重组合均执行上述操作，从而形成交叉后的权重矩阵，如下式所示：

[0041]

[0042] 其中，G″j是G'j经过交叉操作后的第j组二进制码权重组合，G″j,i表示第j组权重组合G″j中第i个特征变量xi的二进制码权重；

[0043] (10)为了防止迭代过程中权重组合不再改变而陷入局部最优，对权重的每一个编码位进行条件变异：根据设定的变异概率Pmu∈(0,1)，对上步交叉后的权重矩阵中的每一个二进制位产生一个随机数rpm∈(0,1)，如果随机数rpm小于Pmu，则将该二进制位取反；否则，保持原来的值不变。从而形成变异后的权重矩阵，如下式所示：

[0044]

[0045] 其中，G′″j是G′″j经过变异操作后的第j组二进制码权重组合，G′″j,i表示第j组权重组合G′″j中第i个特征变量xi的二进制码权重；

[0046] (11)获取权重；若未达到设定的迭代次数Iter，则针对上步变异后的权重矩阵，重复上述的步骤(4)～步骤(10)，直至达到设定的迭代次数Iter时为止，此时，将每次迭代过程中步骤(7)记录的最高准确率max(F1,F2,,Fm)按降序排列，处于第1位的准确率所对应的那一组权重即为所求，记为ω1～ω27，从而完成通过GA迭代训练后分配权重的过程；

[0047] 步骤3：获取目标案例；记目标案例的问题描述数据是Xp+1=(x1,p+1,…,xi,p+1,…,x27,p+1)，待识别的结果记为Yp+1；

[0048] 步骤4：数值归一化；将源案例问题描述Xk=(x1,k,…,xi,k,…,x27,k)，k=1,2,…,p和目标案例问题描述Xp+1=(x1,p+1,…,xi,p+1,…,x27,p+1)中的特征变量的数值进行归一化处理，如下式所示：

[0049] i=1,2,…,27；k=1,2,…,p

[0050] i=1,2,…,27

[0051] 其中，为归一化后第k个源案例的问题描述中第i个特征变量的数值；为归一化后目标案例的问题描述中第i个特征变量的数值；

[0052] 步骤5：案例检索；根据目标案例问题描述与源案例问题描述中归一化后的各个钢板缺陷特征变量的数值以及获得的权重ω1～ω27，计算各源案例与目标案例的相似度sk：

[0053] k＝1,2,…,p

[0054] 可以得到p个相似度，分别是s1～sp；

[0055] 步骤6：案例重用；取出s1～sp中的最大相似度，它对应的源案例的缺陷种类即为目标案例的识别结果Yp+1：

[0056] 步骤7：案例存储；将目标案例的识别结果Yp+1及归一化前的目标案例问题描述Xp+1=(x1,p+1,…,xi,p+1,…,x27,p+1)组成新的源案例存储于案例库中，源案例总数p增1，实现案例库的增量式学习过程。

[0057] 本发明的创造性主要体现在：

[0058] (1)本发明针对钢板特征变量与缺陷种类之间复杂的非线性关系，难以建立起精确的识别缺陷种类的机理模型，根据案例推理技术的特点，采用了案例检索、重用、存储等一系列步骤去实现识别算法，可以有效提高识别的准确率；

[0059] (2)本发明利用遗传算法的迭代寻优能力对案例推理模型中特征变量的权重进行分配，可以避免因为分配不合理权重而降低推理质量的问题，解决了主观法确定权重所具有的不确定性而导致识别准确率低的问题，具有良好的灵敏性和特异性等特点；

[0060] 特别要注意：本发明只是为了描述方便，采用的是对钢板缺陷种类的识别与分类，同样该发明也可适用冶金行业板卷的表面缺陷识别等，只要采用了本发明的原理进行识别与分类都应该属于本发明的范围。附图说明

[0061] 图1为本发明识别钢板缺陷种类的方法流程图；

[0062] 图2为识别准确率对比；

[0063] 图3为识别第I类缺陷的ROC曲线(接受者操作特征曲线，receiver operating characteristic)对比；

[0064] 图4为识别第II类缺陷的对比；

[0065] 图5为识别第III类缺陷的ROC曲线对比；

[0066] 图6为识别第IV类缺陷的ROC曲线对比；

[0067] 图7为识别第V类缺陷的ROC曲线对比；

[0068] 图8为识别第VI类缺陷的ROC曲线对比；

[0069] 图9为识别第VII类缺陷的ROC曲线对比。

具体实施方式

[0070] 本发明获得一种钢板表面缺陷的自动识别方法，该方法采用案例推理技术，通过建立案例库、权重分配、案例检索、案例重用及案例存储等环节建立案例推理识别模型，并实现识别算法，达到通过特征变量的数值变化情况去识别缺陷种类的目的；

[0071] 实验数据来自某钢厂的钢板特征变量参数和缺陷种类年报表；实验样本1941组数据，将全部的1941组数据样本分为两部分：其中1746组数据作为源案例，其余的195组数据作为目标案例；

[0072] 下面结合图1对具体实施方式作进一步说明。

[0073] 1.一种基于案例推理的钢板表面缺陷的自动识别方法，其特征在于包括以下步骤：

[0074] 步骤1：建立案例库；将从生产现场获得的历史数据表示成（钢板缺陷问题描述；钢板缺陷种类）的序偶形式，并存储于案例库中，钢板缺陷问题描述共有27个特征变量，分别用x1,…,x27表示，这27个特征变量包括X最小值、X最大值、Y最小值、Y最大值、像素区域、X周长、Y周长、光度和、最小光度、最大光度、输送辊道长度、钢种(A300)、钢种(A400)、钢板厚度、边缘指数、空指数、平方指数、外部X指数、边缘X指数、边缘Y指数、外部全局指数、面积记录、X指数记录、Y指数记录、取向指数、光度指数和S状弯曲面积，钢板缺陷种类共7类，包括裂纹、Z刮伤、K刮伤、鳞皮、结疤、凸起或其它；其中第k个历史数据构成的源案例表示为

[0075] Ck＝(Xk;Yk),k＝1,2,…,1746

[0076] 其中，p是源案例总数；Xk=(x1,k,…,xi,k,…,x27,k)是第k个源案例的问题描述，xi,k(i=1,2,…,27)表示第k个源案例问题描述中的第i个特征变量的数值，Yk是第k个源案例中的缺陷种类；

[0077] 步骤2：确定各个特征变量的权重；采用遗传算法(genetic algorithms,GA)对权重进行迭代训练后分配，具体为：

[0078] (1)获取训练案例；设定训练权重的案例数量q=1746，记为Ck'＝(Xk';Yk'),k'＝1,2,…,1746；

[0079] (2)数值归一化；将训练案例问题描述Xk'中的每一个特征变量的数值进行归一化处理，如下式所示：

[0080] i＝1,2,…,27；k'＝1,2,…,1746

[0081] 归一化后每个训练案例可表示为 k'＝1,2,…,1746，其中的

[0082]

[0083] (3)参数初始化；设定特征变量初始权重组合的组数m=20、迭代次数Iter=10、交叉概率Pc=0.5、变异概率Pmu=0.04以及对每一个权重进行二进制编码的位数n=3，然后随机产生由20组以3位二进制编码表示的特征变量权重组合组成的初始权重矩阵，如下矩阵形式：

[0084]

[0085] 其中，Gj是以二进制码表示的第j组权重组合，Gj,i表示第j组权重组合Gj中第i个特征变量xi的二进制码权重，表示Gj,i中的第1位数据，以此类推；

[0086] (4)权重解码；对权重矩阵中的每一组二进制码权重组合进行十进制解码，其中第j组二进制码权重组合中的第i个特征变量xi的二进制码权重的解码公式如下：

[0087] i＝1,2,,27,j＝1,2,…,20

[0088] 其中，Dj,i是十进制解码。从而得到以十进制表示的权重矩阵D，如下所示：

[0089]

[0090] 其中，Dj是以十进制表示的第j组权重组合。然后根据Dj,i的值，将特征变量xi的权重值映射至区间[0,1]：

[0091]

[0092] 其中，ωj,i∈[0,1]是特征变量xi的权重。从而得到映射变换后的权重矩阵Ω，如下所示：

[0093]

[0094] 其中，Ωj是第j组权重组合；

[0095] (5)计算相似度；将上步中得到的解码后的20组权重组合Ω1～Ω20分别用1746个训练案例采用留一法进行训练，从1746个训练案例中取出任一个作为目标案例，记为其中剩下的1745个作为新
的源案例，记为 k″＝1,2,,1745，其中计算权
重组合Ω1～Ω20分别作用时目标案例的问题描述与1745个源案例问题描述的相似度，其中第j组权重组合Ωj作用时，相似度sj,k″的计算公式如下：

[0096] k″＝1,2,…,1745

[0097] 通过上述计算可以得到1745个相似度，分别是sj,1～sj,1745(j＝1,2,…,20)；

[0098] (6)利用相似度，依次计算权重组合Ω1～Ω20分别作用时的正确匹配次数，其中，第j组权重组合Ωj作用时，正确匹配次数的计算方法如下：取sj,1～sj,1745中的最大值，该最大值对应的源案例的缺陷种类即为目标案例的匹配结果，如此反复进行1746次，得到1746个匹配结果后，将匹配结果与正确的缺陷种类比对，并记录正确匹配的次数qj′(j＝
1,2,…,20)；

[0099] (7)利用正确匹配次数qj′，依次计算权重组合Ω1～Ω20分别作用时的准确率，其中Ωj作用时的准确率Fj如下式计算：

[0100] Fj＝qj′/q,j＝1,2,…,20

[0101] 并记录本次迭代的最高准确率max(F1,F2,…,F20)；

[0102] (8)利用准确率Fj，依次计算权重组合Ω1～Ω20被选择的概率，其中Ωj被选择的概率Pj如下式计算：

[0103]

[0104] 从而得到Ω1～Ω20被选择的概率P1～P20，采用轮盘赌法得到更新后的二进制码权重矩阵G'=[G1' G'j … G'20]T，其中，G'j是Gj经过选择操作后的第j组二进制码权重组合，T表示矩阵转置。更新方法包括：首先按下式计算出权重组合Ωj被选择的累加概率ΣPj：

[0105] j＝1,2,…,20

[0106] 然后随机产生20个位于区间(0,1)中的实数，并按升序排列成r1，…，rj，…，r20，最后从r1开始，从左至右依次判断r1<ΣP1，…，r1<ΣPj，…，r1<ΣP20是否成立，假设第一个不等式成立的顺序号是j，则第j个被选择的累加概率对应的二进制码权重组合即为G1'，G'2的更新则从第j个累加概率开始，即判断r2<ΣPj，…，r2<ΣP20是否成立，如同G1'的形成方法可得到G'2，以此类推，直至得到G'20，从而得到更新后的二进制码权重矩阵G'；

[0107] (9)交叉：将上步选择后的权重矩阵G'中的20个权重组合从第一个开始，两两配对交叉。具体为：比较设定的交叉概率Pc=0.5和随机产生的实数rpc∈(0,1)大小关系，如果随机数rpc小于0.5，则产生一个随机整数Cpoint∈(0,81)，以此整数为分界点将两两配对的权重组合分别分为左右两部分，右边不含分界点处的二进制数，然后将它们的右边部分互相交换；否则，保持原来的值不变，重复此过程，一直到所有权重组合均执行上述操作，从而形成交叉后的权重矩阵，如下式所示：

[0108]

[0109] 其中，G″j是G'j经过交叉操作后的第j组二进制码权重组合，G′″j,i表示第j组权重组合G″j中第i个特征变量xi的二进制码权重；

[0110] (10)变异：根据设定的变异概率Pmu=0.04，对上步交叉后的权重矩阵中的每一个二进制位产生一个随机数rpm∈(0,1)，如果随机数rpm小于0.04，则将该二进制位取反；否则，保持原来的值不变。从而形成变异后的权重矩阵，如下式所示：

[0111]

[0112] 其中，G′″j是G″j经过变异操作后的第j组二进制码权重组合，G′″j,i表示第j组权重组合G′″j中第i个特征变量xi的二进制码权重；

[0113] (11)获取权重；若未达到设定的迭代次数10次，则针对上步变异后的权重矩阵，重复上述的步骤(4)～步骤(10)，直至达到设定的迭代次数10次时为止，此时，将每次迭代过程中步骤(7)记录的最高准确率max(F1,F2,…,F20)按降序排列，处于第1位的准确率所对应的那一组权重即为所求，记为ω1～ω27，从而完成通过GA迭代训练后分配权重的过程；

[0114] 步骤3：获取目标案例；记目标案例的问题描述数据是X1747=(x1,1747,…,xi,1747,…,x27,1747)，待识别的结果记为Y1747；

[0115] 步骤4：数值归一化；将源案例问题描述Xk=(x1,k,…,xi,k,…,x27,k)，k=1,2,…,1746和目标案例问题描述X1747=(x1,1747,…,xi,1747,…,x27,1747)中的特征变量的数值进行归一化处理，如下式所示：

[0116] i=1,2,…,27；k=1,2,…,1746

[0117] i=1,2,…,27

[0118] 其中，为归一化后第k个源案例的问题描述中第i个特征变量的数值；为归一化后目标案例的问题描述中第i个特征变量的数值；

[0119] 步骤5：案例检索；根据目标案例问题描述与源案例问题描述中归一化后的各个钢板缺陷特征变量的数值以及获得的权重ω1～ω27，计算各源案例与目标案例的相似度sk：

[0120] k＝1,2,…,1746

[0121] 可以得到1746个相似度，分别是s1～s1746；

[0122] 步骤6：案例重用；取出s1～s1746中的最大相似度，它对应的源案例的缺陷种类即为目标案例的识别结果Y1747，并与测试：

[0123] 步骤7：案例存储；将目标案例的识别结果Y1747及归一化前的目标案例问题描述X1747=(x1,1747,…,xi,1747,…,x27,1747)组成新的源案例存储于案例库中，源案例总数1746增1，实现案例库的增量式学习过程。

[0124] 步骤8：若195个目标案例未测试完毕，回到步骤3，并将步骤3及后续步骤中的数字1746 修改为1747，1747则修改为1748，以此类推；若测试完毕则统计和记录准确率(%)，并记录每个缺陷种类的灵敏性(%)和特异性(%)。

[0125] 图2显示各种识别方法的准确率对比，X轴：不同的识别方法，包括平均分配k-近邻方法中的特征变量权重(mean allocation for k-nearest neighbor,MA-KNN)、平均分配案例推理方法中的特征变量权重(mean allocation for case-basedreasoning with k-nearest neighbor,MA-KNN-CBR)、注水法分配案例推理方法中的特征变量权重 (water-filling allocation for case-based reasoning with k-nearest neighbor,WFA-KNN-CBR)、本发明的遗传算法分配案例推理方法中的特征变量权重(genetic algorithm allocation for case-based reasoning with k-nearest neighbor,GA-KNN-CBR)，Y轴：平均准确率，单位是%，结果表明本发明方法的识别准确率最高；图3～图9分别显示7个类别的接受者操作特征曲线(receiver operating characteristic,ROC)，X轴：特异性，单位是%，Y轴：灵敏性，单位是%，结果证明本发明方法对每一个缺陷种类的识别均具有良好的灵敏性和特异性。

标题	发布/更新时间	阅读量
弧面缺陷测量卡	2020-05-12	212
石墨烯缺陷检测	2020-05-12	373
去除缺陷的方法	2020-05-12	336
软件缺陷验证	2020-05-13	726
色觉缺陷校正	2020-05-13	472
绝缘缺陷的检测	2020-05-13	268
缺陷知识库	2020-05-11	118
缺陷平面化	2020-05-11	367
AGSE缺陷菌株	2020-05-11	960
缺陷检测装置、缺陷修正装置及缺陷检测方法	2020-05-12	289

基于案例推理的钢板表面缺陷的自动识别方法

基于案例推理的钢板表面缺陷的自动识别方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：