首页 / 专利库 / 人工智能 / 人工神经网络 / 自组织映射 / 一种挖掘焊接参数量化关联规则的方法及应用

一种挖掘焊接参数量化关联规则的方法及应用

阅读:678发布:2020-05-11

专利汇可以提供一种挖掘焊接参数量化关联规则的方法及应用专利检索,专利查询,专利分析的服务。并且本 发明 属于 焊接 质量 控制领域,并具体公开了一种挖掘焊接参数量化关联规则的方法及应用。包括如下步骤: 对焊 接工艺参数及测量信息的数值型属性数据分别进行归一化处理,确定与焊接质量相关的关键焊接参量;将关键焊接参量的数值型属性数据作为训练样点集,对其中一个关键焊接参量的训练样点集进行区间划分,以获取量化关联规则的划分区间;然后将关键焊接参量的训练样点集中的各训练样点映射为布尔型数据;重复上述步骤,直至获取各关键焊接参量的各个区间的布尔型数据,并根据该布尔型数据以及焊接质量的布尔型 数据挖掘 焊接参数量化关联规则。本发明将焊接多值型关联规则挖掘问题转化为布尔型关联规则挖掘问题,能得到高质量的量化关联规则。,下面是一种挖掘焊接参数量化关联规则的方法及应用专利的具体信息内容。

1.一种挖掘焊接参数量化关联规则的方法,其特征在于,包括以下步骤:
S1对焊接工艺参数及测量信息的数值型属性数据分别进行归一化处理,并确定与焊接质量相关的关键焊接参量;
S2将所述关键焊接参量的数值型属性数据作为训练样点集,对其中一个所述关键焊接参量的训练样点集进行区间划分,以获取量化关联规则的划分区间;
S3根据步骤S2得到的划分区间,将所述关键焊接参量的训练样点集中的各训练样点映射为布尔型数据;
S4重复步骤S2和S3,直至获取各关键焊接参量的各个区间的布尔型数据,并根据该布尔型数据以及焊接质量的布尔型数据挖掘焊接参数量化关联规则。
2.根据权利要求1所述的方法,其特征在于,步骤2中,采用基于密度聚类与模糊聚类的自组织聚类方法,对其中一个所述关键焊接参量的训练样点集进行区间划分,其具体包括以下步骤:
S21对于其中任意一个关键焊接参量,采用基于共享相似度与欧式距离统一度量的密度聚类的方法确定该关键焊接参量的多个聚类中心样点 并根据多个聚类中心
样点 对组成该关键焊接参量的训练样点集中的训练样点进行初始聚类划分,以
获取Kinitial个类;
S22采用基于模糊聚类的自组织聚类方法,对上述多个聚类中心样点 进行
聚类中心样点个数的自组织调节,以获取新的聚类中心样点;
S23根据步骤S22获取的新的聚类中心样点及最大隶属度原则得到量化关联规则的划
分区间。
3.根据权利要求2所述的方法,其特征在于,步骤S21包括以下步骤:
S211根据关键焊接参量中各训练样点的KNN(i)和RNN(i),构建各训练样点的自然近邻模型,以获取各训练样点的自然近邻,1≤i≤N,其中,N为该关键焊接参量中训练样点的总个数;
S212采用基于共享相似度与欧式距离统一度量的方法计算每个训练样点的局部密度
Rho(i),直至获取所有训练样点的局部密度Rho(i),所述Rho(i)的计算模型如下:
Rho(i)=SharedRho(i)+NonSharedRho(i)
其中,SharedRho(i)为共享密度,NonSharedRho(i)为非共享密度;
S213根据步骤S212得到的所有训练样点的局部密度Rho(i),对关键焊接参量中所有训练样点的局部密度Rho(i)进行降序排列,并计算每个训练样点的高密度样点距离Δ(i),直至获取所有训练样点的高密度样点距离Δ(i);
S214根据步骤S212和步骤S213所有训练样点的局部密度Rho(i)和高密度样点距离Δ
(i),获取每个训练样点的决策值γ(i),对γ[γ(1)....γ(i)....γ(N)]进行降序排列,并选取γ[γ(1)....γ(i)....γ(N)]最大的前Kinitial个训练样点作为该关键焊接参量的聚类中心样点
S215对剩余的非聚类中心样点的训练样点,按照各训练样点局部密度的降序进行遍
历,将剩余的非聚类中心样点的训练样点分配至距其最近、且局部密度大于其局部密度的训练样点所在的类,从而完成该关键焊接参量的训练样点的初始聚类划分。
4.根据权利要求3所述的方法,其特征在于,所述自然近邻模型如下:
3N(i)=KNN(i)∩RNN(i)
其中,3N(i)为训练样点i的自然近邻;
优选的,所述共享密度的计算模型为:
其中,3N(i)为训练样点xi的自然近邻,j=1,2,...,Nnear,Nnear为各训练样点自然近邻的个数,λ为共享密度权重因子,SKNN(i,j)为训练样点xi与其自然近邻中各样点xj共享KNN的个数,SRNN(i,j)为训练样点xi与其自然近邻中各样点xj共享RNN的个数,d(xi,xj)为训练样点xi与自然近邻中各样点xj的欧式距离;
优选的,所述非共享密度的计算模型为:
其中,d(xi,xq)为训练样点xi与其非自然近邻中各样点xq的欧式距离,1≤q≤N,ωq为非共享密度权重因子;
优选的,所述高密度样点距离Δ(i)的计算模型如下:
其中,d(xi,xp)为训练样点xi与所有样点xp的欧式距离;1≤p≤N,其中,N为该关键焊接参量中训练样点的总个数;Rho(i)为训练样点xi的局部密度,Rho(p)为训练样点xp的局部密度,max(Rho)为所有训练样点中的最大局部密度。
5.根据权利要求2所述的方法,其特征在于,步骤S22包括以下步骤:
S221将多个聚类中心样点 和初始聚类划分的结果作为当前聚类中心样点
和当前聚类划分,并记当前迭代次数为Inow;
S222根据当前聚类中心样点获取各训练样点的初始的模糊隶属度
S223根据各训练样点的初始的模糊隶属度 判断Kinitial个类中,每个类中训练样点的个数是否满足阈值,若满足,则进入S224,若不满足,则丢弃该类,并给当前聚类的个数赋值Kinitial=Kinitial-1,然后转至S222,重新根据当前聚类中心样点获取各训练样点的初始的模糊隶属度
S224修正Kinitial个类中各类的聚类中心样点 以获取关键焊接参量的
Kinitial个新的聚类中心样点,同时据此更新关键焊接参量中各训练样点的初始的模糊隶属度
S225根据各训练样点的更新后的初始的模糊隶属度 获取每个类中,所有训练样点与新的聚类中心样点间的模糊平均距离,接着,以此获取Kinitial个类的总平均距离
S226根据目标函数值J、当前迭代次数Inow和Kinitial个类的总平均距离 判断否进行合并、分裂或迭代操作,若目标函数值J收敛或当前迭代次数Inow达到阈值I,则结束自组织调节,进入步骤S23,若目标函数值J不收敛或当前迭代次数Inow未达到阈值I,当Kinitial≤Kexpected/2,转至分裂操作,当Kinitial≥2*Kexpected,转至合并操作,当Kexpected/2<Kinitial<2*Kexpected,同时Inow为奇数时,转至分裂操作,当Kexpected/2<Kinitial<2*Kexpected,同时Inow为偶数时转至合并操作,直至目标函数值J收敛或当前迭代次数Inow达到阈值I,以获取最终得到的聚类中心 和Kfinal个类,其中,Kexpected为预期聚类个数,Inow为当前迭代次数。
6.根据权利要求5所述的方法,其特征在于,所述 的计算模型如下:
其中,m为模糊参数,d(xj,ci)为训练样点xj与新的聚类中心样点ci的欧式距离,d(xj,ck)为训练样点xj与新的聚类中心样点ck的欧式距离;
所述判断模型如下:
其中, 为类内训练样点个数下限阈值;
步骤S224中,所述聚类中心样点Ci修正模型如下:
其中,m为模糊参数,uij为训练样点xj的初始的模糊隶属度;
所述目标函数值J的计算模型如下:
其中,m为模糊参数,d(xj,ci)为训练样点xj与聚类中心样点ci的欧式距离,uij为训练样点xj的初始的模糊隶属度。
7.根据权利要求5所述的方法,其特征在于,步骤S226中,所述分裂操作具体包括以下步骤:
S2261针对每个类,计算该类的标准差σ,所述标准差σ的计算模型如下:
其中,xj为训练样点,ci为第i个聚类中心;
S2262判断每个类的标准差σ是否大于θstd,若否,则记当前迭代次数Inow=Inow+1,并进入步骤S222,若是,再继续判断是否满足分裂条件,若否,则记当前迭代次数Inow=Inow+1,并进入步骤S222,若是,则进行分裂操作,以获取更新后的聚类中心样点,并将其作为当前聚类中心样点,并进入步骤S222;
其中,步骤S2262中,所述分裂条件如下:
或者Kinitial≤Kexpected/2
其中,为所有测试训练样点与聚类中心样点间的模糊平均距离;
进一步的,步骤S226中,所述合并操作具体包括以下步骤:
S2264判断所有类的聚类中心样点两两之间的距离Dpq,对于小于 的Dpq进行升序排
列;
S2265对于前Lpair个Dpq所在的Lpair对类进行合并,以获取更新后的聚类中心样点,并将其作为当前聚类中心样点,记当前迭代次数Inow=Inow+1,并进入步骤S222;
其中,θstd为类内训练样点分布的距离标准差上限阈值, 为两个聚类中心样点间的预定距离,Lpair为每次迭代运算中允许合并的聚类中心样点的对数。
8.根据权利要求1所述的方法,其特征在于,步骤S3中,将各区间内的训练样点映射为布尔型数据具体包括以下步骤:
S31将步骤S2划分得到的各区间依次取为布尔型属性;
S32依次读取所述关键焊接参量的训练样点,判断训练样点是否落在该关键焊接参量的其中一个划分区间中,若是则取1,反之取0;
S33重复步骤S32,直至遍历所述关键焊接参量的各个划分区间,从而将所述关键焊接参量的训练样点映射为布尔型数据。
9.根据权利要求1-8任一项所述的方法,其特征在于,步骤S4中,根据所述布尔型数据,采用Apriori算法提取焊接工艺参数及测量信息与焊接质量之间的频繁项集,以据挖掘焊接参数量化关联规则,其具体包括以下步骤:
S41依次扫描各关键焊接参量的各个区间的布尔型数据以及焊接质量的布尔型数据,采用Apriori算法依次迭代得到焊接工艺参数及测量信息与焊接质量之间候选n项集,并计算其支持度,若候选n项集的支持度大于支持度阈值,且该候选n项集中包括焊接质量,则记入频繁n项集,否则,舍弃该候选n项集,得到所有频繁n项集后,将频繁n项集两两连接得到候选n+1项集,进入步骤S42,继续进行迭代,并记当前迭代次数为k=n,n≥1;
S42重复步骤S41,直至频繁n+1项集为空集,或者频繁n+1项集中不包括焊接质量,结束迭代,得到所有频繁项集的候选规则;
S43根据步骤S42得到的所有频繁项集的候选规则,计算其置信度,若其中一个频繁项集的候选规则的置信度大于置信度阈值,则记入强关联规则,判断频繁项集的候选规则后生成焊接参数量化关联规则。
10.一种采用权利要求1-9任一项所述方法判断焊接质量的方法,其特征在于,将新的焊接信息与挖掘的量化焊接参数关联规则进行匹配,以预测焊接质量类别,其具体包括以下步骤:
S51将新的焊接信息的数值型数据作为测试样点,依次判断测试样点所属的关键焊接参量,接着判断该测试样点落在该关键焊接参量的哪个划分区间,并据此将新的焊接信息的测试样点映射成布尔型数据;
S52将步骤S51获取的布尔型数据与步骤S4挖掘得到的量化焊接参数关联规则的前件
进行匹配,从而根据相应规则后件预测新的焊接的质量类别。

说明书全文

一种挖掘焊接参数量化关联规则的方法及应用

技术领域

[0001] 本发明属于焊接质量控制领域,更具体地,涉及一种挖掘焊接参数量化关联规则的方法及应用。

背景技术

[0002] 焊接中,通过对焊接过程进行控制以获得满意的焊接质量,是焊接领域的研究热点。传统的手工焊接方式依靠焊工感官检测和技能控制保证焊接质量,已无法满足先进制造的要求,焊接过程自动化、机器人化和智能化成为必然发展趋势。随着计算机和数据库技术的发展,焊接工艺过程中的大量数据得到快速搜集和存储,其蕴含着许多对决策与控制有用的信息,基于数据挖掘技术来指导生产中的质量管理具有重大应用价值。
[0003] 焊接过程的控制系统由三项关键技术组成:焊接过程传感器,实时检测和获取焊接信息;焊接过程建模,提供对过程的规律性认识;焊接过程控制器,实现合理的控制规律。其中,焊接过程模型是系统控制的对象,研究焊接工艺参数与焊接质量特征之间的关系,建立高精度的质量预测模型是焊接过程控制系统设计的关键环节。为了从焊接数据中提取潜在的、有价值的焊接工艺知识,应用关联规则进行工艺参量影响焊接质量的潜在联系。关联规则是数据挖掘中最重要的任务之一,它的目的是发现数据集中所有的频繁模式和强关联规则,可在焊接工艺中寻找蕴藏的规律以制定质量控制方案。根据属性类别,可分为布尔型关联规则和多值型关联规则,针对多值型关联规则,也称量化关联规则,常考虑转换为布尔型关联规则问题。当属性全部取值是有限个数时,如类别型属性,则将每个属性值映射为一个布尔型属性即可;当属性的取值范围很宽时,如数值型属性,则需将其划分为若干个区间,再将每个区间映射为一个布尔型属性。于是,基于此思路对多值型关联规则挖掘算法的研究就转化为对其数值型属性区间划分的合理性研究,即属性的离散化。常用的离散化方法为等宽度、等频率和基于聚类的方法。前两者都是从数学度进行划分,没有考虑到数据分布,可能遗失许多信息,造成关联规则提取不到。采用基于聚类的方法,能将数值型属性的取值划分为能有效反映数据实际分布情况的若干个区间。聚类算法主要分为基于划分的、基于层次的、基于密度的、基于网格的和基于模糊的方法等。
[0004] 相比基于经典集合理论的硬聚类,基于模糊集合理论的模糊划分能够有效软化属性区间的划分边界,在集合元素与非集合元素之间提供平滑的变迁。基于划分的ISODATA聚类算法是一种对数据使用迭代自组织的数据分析算法,能在聚类过程中根据类与样本的实际情况动态调整聚类个数,避免事先固定不当的聚类个数。在ISODATA算法中引入模糊划分思想,既能动态调整得到更准确的聚类个数,又能消除硬性划分区间带来的弊端。但初始聚类中心的随机选取会造成后续聚类结果不佳。而简单高效的基于密度的密度峰值聚类DPC能自动确定聚类个数并通过决策图快速发现聚类中心,但由于算法使用了全局参数,当数据中存在密度相差较大的簇时,聚类中心不能合理选取。基于这些聚类的方法对属性离散化时,聚类结果不准确,属性区间划分不合理,造成后续关联规则无法正确提取。
[0005] 因此,针对基于关联规则的焊接质量分析,提出一种数值型属性区间划分准确、关联规则质量高的量化关联分析方法具有重要意义。

发明内容

[0006] 针对现有技术的以上缺陷或改进需求,本发明提供了一种挖掘焊接参数量化关联规则的方法及应用,其中结合聚类分析方法自身的特征及其焊接工艺特点,相应提供一种数值型属性区间划分准确、关联规则质量高的量化关联分析方法,基于密度聚类与基于模糊聚类的统一聚类结果划分的属性区间作为关联规则挖掘的输入,将多值型关联规则挖掘问题转化为布尔型关联规则挖掘问题,能得到高质量的量化关联规则。
[0007] 为实现上述目的,按照本发明的一个方面,提出了一种挖掘焊接参数量化关联规则的方法,包括以下步骤:
[0008] S1对焊接工艺参数及测量信息的数值型属性数据分别进行归一化处理,并确定与焊接质量相关的关键焊接参量;
[0009] S2将所述关键焊接参量的数值型属性数据作为训练样点集,对其中一个所述关键焊接参量的训练样点集进行区间划分,以获取量化关联规则的划分区间;
[0010] S3根据步骤S2得到的划分区间,将所述关键焊接参量的训练样点集中的各训练样点映射为布尔型数据;
[0011] S4重复步骤S2和S3,直至获取各关键焊接参量的各个区间的布尔型数据,并根据该布尔型数据以及焊接质量的布尔型数据挖掘焊接参数量化关联规则。
[0012] 进一步的,步骤2中,采用基于密度聚类与模糊聚类的自组织聚类方法,对其中一个所述关键焊接参量的训练样点集进行区间划分,其具体包括以下步骤:
[0013] S21对于其中任意一个关键焊接参量,采用基于共享相似度与欧式距离统一度量的密度聚类的方法确定该关键焊接参量的多个聚类中心样点 并根据多个聚类中心样点 对组成该关键焊接参量的训练样点集中的训练样点进行初始聚类划
分,以获取Kinitial个类;
[0014] S212采用基于共享相似度与欧式距离统一度量的方法计算每个训练样点的局部密度Rho(i),直至获取所有训练样点的局部密度Rho(i),所述Rho(i)的计算模型如下:
[0015] Rho(i)=SharedRho(i)+NonSharedRho(i)
[0016] 其中,SharedRho(i)为共享密度,NonSharedRho(i)为非共享密度;
[0017] S213根据步骤S212得到的所有训练样点的局部密度Rho(i),对关键焊接参量中所有训练样点的局部密度Rho(i)进行降序排列,并计算每个训练样点的高密度样点距离Δ(i),直至获取所有训练样点的高密度样点距离Δ(i);
[0018] S214根据步骤S212和步骤S213所有训练样点的局部密度Rho(i)和高密度样点距离Δ(i),获取每个训练样点的决策值γ(i),对γ[γ(1)....γ(i)....γ(N)]进行降序排列,并选取γ[γ(1)....γ(i)....γ(N)]最大的前Kinitial个训练样点作为该关键焊接参量的聚类中心样点
[0019] S215对剩余的非聚类中心样点的训练样点,按照各训练样点局部密度的降序进行遍历,将剩余的非聚类中心样点的训练样点分配至距其最近、且局部密度大于其局部密度的训练样点所在的类,从而完成该关键焊接参量的训练样点的初始聚类划分。
[0020] 进一步的,所述自然近邻模型如下:
[0021] 3N(i)=KNN(i)∩RNN(i)
[0022] 其中,3N(i)为训练样点i的自然近邻;
[0023] 优选的,所述共享密度的计算模型为:
[0024]
[0025] 其中,3N(i)为训练样点xi的自然近邻,j=1,2,...,Nnear,Nnear为各训练样点自然近邻的个数,λ为共享密度权重因子,SKNN(i,j)为训练样点xi与其自然近邻中各样点xj共享KNN的个数,SRNN(i,j)为训练样点xi与其自然近邻中各样点xj共享RNN的个数,d(xi,xj)为训练样点xi与自然近邻中各样点xj的欧式距离;
[0026] 优选的,所述非共享密度的计算模型为:
[0027]
[0028] 其中,d(xi,xq)为训练样点xi与其非自然近邻中各样点xq的欧式距离,1≤q≤N,ωq为非共享密度权重因子;
[0029] 优选的,所述高密度样点距离Δ(i)的计算模型如下:
[0030]
[0031] 其中,d(xi,xp)为训练样点xi与所有样点xp的欧式距离;1≤p≤N,其中,N为该关键焊接参量中训练样点的总个数;Rho(i)为训练样点xi的局部密度,Rho(p)为训练样点xp的局部密度,max(Rho)为所有训练样点中的最大局部密度。
[0032] 进一步的,步骤S22包括以下步骤:
[0033] S221将多个聚类中心样点 和初始聚类划分的结果作为当前聚类中心样点和当前聚类划分,并记当前迭代次数为Inow;
[0034] S222根据当前聚类中心样点获取各训练样点的初始的模糊隶属度uij;
[0035] S223根据各训练样点的初始的模糊隶属度uij判断Kinitial个类中,每个类中训练样点的个数是否满足阈值,若满足,则进入S224,若不满足,则丢弃该类,并给当前聚类的个数赋值Kinitial=Kinitial-1,然后转至S222,重新根据当前聚类中心样点获取各训练样点的初始的模糊隶属度uij;
[0036] S224修正Kinitial个类中各类的聚类中心样点 以获取关键焊接参量的Kinitial个新的聚类中心样点,同时据此更新关键焊接参量中各训练样点的初始的模糊隶属度uj;
[0037] S225根据各训练样点的更新后的初始的模糊隶属度uj获取每个类中,所有训练样点与新的聚类中心样点间的模糊平均距离,接着,以此获取Kinitial个类的总平均距离[0038] S226根据目标函数值J、当前迭代次数Inow和Kinitial个类的总平均距离 判断否进行合并、分裂或迭代操作,若目标函数值J收敛或当前迭代次数Inow达到阈值I,则结束自组织调节,进入步骤S23,若目标函数值J不收敛或当前迭代次数Inow未达到阈值I,当Kinitial≤Kexpected/2,转至分裂操作,当Kinitial≥2*Kexpected,转至合并操作,当Kexpected/2<Kinitial<2*Kexpected,同时Inow为奇数时,转至分裂操作,当Kexpected/2<Kinitial<2*Kexpected,同时Inow为偶数时转至合并操作,直至目标函数值J收敛或当前迭代次数Inow达到阈值I,以获取最终得到的聚类中心 和Kfinal个类,其中,Kexpected为预期聚类个数,Inow为当前迭代次数。
[0039] 进一步的,所述uij的计算模型如下:
[0040]
[0041] 其中,m为模糊参数,d(xj,ci)为训练样点xj与新的聚类中心样点ci的欧式距离,d(xj,ck)为训练样点xj与新的聚类中心样点ck的欧式距离;
[0042] 所述判断模型如下:
[0043]
[0044] 其中, 为类内训练样点个数下限阈值;
[0045] 步骤S224中,所述聚类中心样点Ci修正模型如下:
[0046]
[0047] 其中,m为模糊参数,uij为训练样点xj的初始的模糊隶属度;
[0048] 所述目标函数值J的计算模型如下:
[0049]
[0050] 其中,m为模糊参数,d(xj,ci)为训练样点xj与聚类中心样点ci的欧式距离,uij为训练样点xj的初始的模糊隶属度。
[0051] 进一步的,步骤S226中,所述分裂操作具体包括以下步骤:
[0052] S2261针对每个类,计算该类的标准差σ,所述标准差σ的计算模型如下:
[0053]
[0054] 其中,xj为训练样点,ci为第i个聚类中心;
[0055] S2262判断每个类的标准差σ是否大于θstd,若否,则记当前迭代次数Inow=Inow+1,并进入步骤S222,若是,再继续判断是否满足分裂条件,若否,则记当前迭代次数Inow=Inow+1,并进入步骤S222,若是,则进行分裂操作,以获取更新后的聚类中心样点,并将其作为当前聚类中心样点,并进入步骤S222;
[0056] 其中,步骤S2262中,所述分裂条件如下:
[0057] 或者Kinitial≤Kexpected/2
[0058] 其中,为所有测试训练样点与聚类中心样点间的模糊平均距离;
[0059] 进一步的,步骤S226中,所述合并操作具体包括以下步骤:
[0060] S2264判断所有类的聚类中心样点两两之间的距离Dpq,对于小于 的Dpq进行升序排列;
[0061] S2265对于前Lpair个Dpq所在的Lpair对类进行合并,以获取更新后的聚类中心样点,并将其作为当前聚类中心样点,记当前迭代次数Inow=Inow+1,并进入步骤S222;
[0062] 其中,θstd为类内训练样点分布的距离标准差上限阈值, 为两个聚类中心样点间的预定距离,Lpair为每次迭代运算中允许合并的聚类中心样点的对数。
[0063] 进一步的,步骤S3中,将各区间内的训练样点映射为布尔型数据具体包括以下步骤:
[0064] S31将步骤S2划分得到的各区间依次取为布尔型属性;
[0065] S32依次读取所述关键焊接参量的训练样点,判断训练样点是否落在该关键焊接参量的其中一个划分区间中,若是则取1,反之取0;
[0066] S33重复步骤S32,直至遍历所述关键焊接参量的各个划分区间,从而将所述关键焊接参量的训练样点映射为布尔型数据。
[0067] 进一步的,步骤S4中,根据所述布尔型数据,采用Apriori算法提取焊接工艺参数及测量信息与焊接质量之间的频繁项集,以据挖掘焊接参数量化关联规则,其具体包括以下步骤:
[0068] S41依次扫描各关键焊接参量的各个区间的布尔型数据以及焊接质量的布尔型数据,采用Apriori算法依次迭代得到焊接工艺参数及测量信息与焊接质量之间候选n项集,并计算其支持度,若候选n项集的支持度大于支持度阈值,且该候选n项集中包括焊接质量,则记入频繁n项集,否则,舍弃该候选n项集,得到所有频繁n项集后,将频繁n项集两两连接得到候选n+1项集,进入步骤S42,继续进行迭代,并记当前迭代次数为k=n,n≥1;
[0069] S42重复步骤S41,直至频繁n+1项集为空集,或者频繁n+1项集中不包括焊接质量,结束迭代,得到所有频繁项集的候选规则;
[0070] S43根据步骤S42得到的所有频繁项集的候选规则,计算其置信度,若其中一个频繁项集的候选规则的置信度大于置信度阈值,则记入强关联规则,判断频繁项集的候选规则后生成焊接参数量化关联规则。
[0071] 按照本发明的另一个方面,本发明提供了一种采用上述方法判断焊接质量的方法,将新的焊接信息与挖掘的量化焊接参数关联规则进行匹配,以预测焊接质量类别,其具体包括以下步骤:
[0072] S51将新的焊接信息的数值型数据作为测试样点,依次判断测试样点所属的关键焊接参量,接着判断该测试样点落在该关键焊接参量的哪个划分区间,并据此将新的焊接信息的测试样点映射成布尔型数据;
[0073] S52将步骤S51获取的布尔型数据与步骤S4挖掘得到的量化焊接参数关联规则的前件进行匹配,从而根据相应规则后件预测新的焊接的质量类别。
[0074] 总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
[0075] 1.本发明通过对焊接工艺参数及测量信息的数值型属性数据进行处理和划分,同时将获取关键焊接参量的属性区间作为关联规则挖掘的输入,将多值型关联规则挖掘问题转化为布尔型关联规则挖掘问题,能得到高质量的量化关联规则,同时,本发明不局限于任何一种布尔型关联规则挖掘算法,任何布尔型关联规则挖掘算法都可以很好地与本发明提供的技术方案相结合。
[0076] 2.本发明基于密度聚类与基于模糊聚类的统一聚类结果划分的属性区间作为关联规则挖掘的输入,将多值型关联规则挖掘问题转化为布尔型关联规则挖掘问题,同时虑了共享相似度与欧式距离的统一进行样本局部密度的度量,在共享相似度的计算中既考虑了近邻点与非近邻点的带权重差别的影响,也考虑了不同近邻点的带权重差别的影响,使得局部密度度量可靠性提高;
[0077] 3.本发明利用基于密度聚类的聚类中心样点作为自组织模糊聚类的初始输入,消除随机确定初始聚类中心的影响;同时本发明对密度变化尺度较大的属性数据能离散化成合理的区间,为焊接关联规则的质量提高基础
[0078] 4.本发明在进行每个训练样点局部密度的度量时,由两项组成,前项考察其自然近邻样本的距离对当前训练样本的影响;后项考察其非自然近邻样本的距离对当前训练样点的影响。
[0079] 5.本发明在局部密度的前项的权重中,“+1”项保证自然近邻样本的权重恒大于或等于1;在后项的权重中,权重恒小于或等于1,保证了整体上自然近邻样本的权重恒大于非自然近邻样本的权重。
[0080] 6.本发明在局部密度的前项的权重中,加入共享近邻点的影响,消除了一定的仅有欧式距离进行度量时的弊端,依据不同自然近邻样本与当前训练样点之间的共享K近邻与共享逆近邻的个数,使得不同的自然近邻样本的权重也不完全相同;在后项的权重中,依据距离当前训练样点的距离进行权重赋值,使得不同的非自然近邻样本的权重不同。
[0081] 7.将基于密度聚类的方法选取的聚类中心作为初始聚类中心,结合模糊划分的ISODATA算法,进行聚类中心样点个数自组织调节的聚类,以此作为最终的聚类结果进行属性区间划分。
[0082] 8.本发明基于属性区间划分结果作为关联规则挖掘的输入,将多值型关联规则挖掘问题转化为布尔型关联规则挖掘问题,挖掘量化关联规则。附图说明
[0083] 图1是本发明实施例涉及的一种挖掘焊接参数量化关联规则的方法及应用的流程图

具体实施方式

[0084] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0085] 如图1所示,本发明提供了一种挖掘焊接参数量化关联规则的方法,其具体包括以下步骤:
[0086] S1对焊接工艺参数及测量信息的数值型属性数据分别进行归一化处理,并确定与焊接质量相关的关键焊接参量;
[0087] S2将所述关键焊接参量的数值型属性数据作为训练样点集,对其中一个所述关键焊接参量的训练样点集进行区间划分,以获取量化关联规则的划分区间;
[0088] S3根据步骤S2得到的划分区间,将所述关键焊接参量的训练样点集中的各训练样点映射为布尔型数据;
[0089] S4重复步骤S2和S3,直至获取各关键焊接参量的各个区间的布尔型数据,并根据该布尔型数据以及焊接质量的布尔型数据挖掘焊接参数量化关联规则。
[0090] 在本发明中,焊接工艺参数具体包括焊接速度、焊接电流焊枪位姿角度等,测量信息包括装配间隙、装配错边等。
[0091] 具体而言,本发明步骤S1中,在对焊接工艺参数及测量信息的数值型数据分别进行归一化处理和关键焊接参量筛选之前,还需对焊接工艺参数及测量信息的数值型数据进行缺失值填补和异常值修正处理,该填补和修正处理的过程具体如下:
[0092] 首先,将某个关键焊接参量的数值型数据所构成的集合看作为训练样本集,将某个关键焊接参量的数值型数据中的样点看作为训练样点,然后计算训练样点与各个训练样本之间的距离,其中,该计算模型为欧式距离模型,所述欧式距离模型如下:
[0093]
[0094] 其中,xi为训练样点,yi为各个训练样本。
[0095] 然后,将计算得到的该训练样点与训练样本中各个训练样点之间的距离与设定的阈值范围进行比较,若距离在阈值范围外,则取该训练样点相邻的K个训练样点的均值作为该训练样点的数值;若距离在阈值范围内,则该训练样点的数值不变。最后重复上述步骤,以完成对焊接工艺参数及测量信息的数值型数据进行修正处理,进而获取修正后的数值型数据。
[0096] 进一步的,步骤S1中,归一化处理具体包括以下步骤:
[0097] 首先,采用min-max归一化方法对修正后的焊接参量的数值型数据进行无量纲标准化处理;
[0098] 所述min-max归一化方法所采用的模型如下:
[0099] xi*=(xi-min)/(max-min)            (2)
[0100] 其中,max和min分别为修正后的焊接参量的数值型数据的最大值和最小值,xi*为xi进行无量纲标准化处理后的数值。
[0101] 进一步的,步骤S1中,采用基于重要性度量的灵敏度分析方法确定与焊接质量显著相关的关键焊接参量,具体包括以下步骤:
[0102] 采用皮尔逊相关系数模型、标准回归系数模型和偏相关系数模型获取重要性指标,然后对所获取的重要性指标进行综合分析,以确认与焊缝形貌尺寸显著相关的关键焊接参量,并以此来确定与焊接质量显著相关的关键焊接参量,其中,皮尔逊相关系数模型、标准回归系数模型和偏相关系数模型分别如下:
[0103]
[0104]
[0105]
[0106] 其中, 为n组样本对,X为待分析的焊接参量,Y为焊缝形貌尺寸, 和 分别表示除去第j个变量的样本输入和依此建立的模型的预测输出。其中,ρ(Xj,Y)为皮尔逊相关系数,其取值在-1与+1之间,正值表明两个变量正相关,负值表明两个变量负相关,相关系数越接近于1或-1,相关性越强;相关系数越接近于0,相关度越弱。SRCj为标准回归系数,其回归方程为Y=b0+b1X1+...+bjXj+...+bkXk,其中,X1,...,Xk为k个自变量,Y为因变量,b0,b1,...,bk为参数,由最小二乘法求得。标准化回归系数绝对值越大,可认为它对因变量的影响就越大,βj为常数。PCCj为偏相关系数,ρ为皮尔逊相关系数。
[0107] 本发明步骤S2具体包括以下步骤:
[0108] S21对于其中任意一个关键焊接参量,采用基于共享相似度与欧式距离统一度量的密度聚类的方法确定该关键焊接参量的多个聚类中心样点,并根据多个聚类中心样点对组成该关键焊接参量的数值型数据进行初始聚类划分。其具体包括以下子步骤:
[0109] S211给各参数赋值,K近邻个数Knear,初始聚类个数Kinitial;
[0110] S212计算训练样点与训练样本中各样点之间的距离,其中,所述距离采用欧式距离公式计算;
[0111] S213对距离进行升序排列,选取每个训练样点距离最小的Knear个点,记为其K近邻KNN(i);
[0112] S214重复步骤S212和S213得到的所有训练样本中各训练样点的KNN,并根据各训练样点的KNN得到所有训练样本中各训练样点的逆近邻RNN,其中,获取所述RNN的模型如下:
[0113] RNN(i)={j∈N|i∈KNN(j)}           (6)
[0114] 其中,j=1,2,...,Nnear,Nnear为自然近邻样点个数。
[0115] S215根据各训练样点的KNN(i)和RNN(i),构建各训练样点的自然近邻模型,以获取各训练样点的自然近邻3N(i),该自然近邻模型如下:
[0116] 3N(i)=KNN(i)∩RNN(i)           (7)
[0117] S216采用基于共享相似度与欧式距离统一度量的方法计算每个训练样点的局部密度Rho(i),其中,所述Rho(i)的计算模型如下:
[0118] Rho(i)=SharedRho(i)+NonSharedRho(i)            (8)
[0119] 其中,SharedRho(i)为共享密度,NonSharedRho(i)为非共享密度。
[0120] 更进一步的,所述共享密度计算模型如下:
[0121]
[0122] 所述非共享密度计算模型如下:
[0123]
[0124] 其中,xj为训练样点的自然近邻样点,j=1,2,...,Nnear,Nnear为自然近邻样点个数,λ为共享密度权重因子,为公平起见,设为0.5,SKNN(i,j)为训练样点xi与其自然近邻样本xj共享K近邻的个数,SRNN(i,j)为训练样点xi与其自然近邻样本xj共享逆近邻的个数,分别采用如下计算模型:
[0125] SKNN(i,j)j∈3N(i)=|KNN(i)∩KNN(j)|        (11)
[0126] SRNN(i,j)j∈3N(i)=|RNN(i)∩RNN(j)|           (12)
[0127] |·|为个数,共享密度计算模型中的+1项是为了保证自然近邻样点的权重至少为1,q=1,2,...,N-Nnear-1为测试样点的非自然近邻样点,N为训练样本总个数,N-Nnear-1为非自然近邻样本个数,且依据与测试样点的距离升序排列,ωq为依据距离赋予的非共享密度权重,其计算模型如下:
[0128] ωq=1/q2,q=1,2,...,N-Nnear-1         (13)
[0129] 可见,每个训练样点的局部密度Rho(i)由两项组成,意在考察其它训练样本与当前测试样点的欧式距离度量时,依据近邻程度赋予不同权重,前项SharedRho(i)为考察其自然近邻样点,权重恒大于或等于1;后项NonSharedRho(i)为考察其非自然近邻样点,权重恒小于或等于1,即保证了自然近邻样点的权重恒大于非自然近邻样点的权重。其中,在前项SharedRho(i)的计算中,依据不同自然近邻样点与训练样点之间的共享K近邻与共享逆近邻的个数加权和作为共享相似度权重,既使得不同自然近邻样点的权重不同时取为1,也因为相似度的度量不受距离影响,从而避免了在面对密度变化尺度较大的训练数据进行局部密度计算时,仅采用欧式距离度量带来的弊端;在后项NonSharedRho(i)的计算中,权重ωq依据距离测试样点远近进行赋予,使得不同非自然近邻样点的权重不同,距离越近,权重越大,反之亦然。
[0130] S217根据步骤S216得到的每个训练样点的局部密度Rho(i),对Rho进行降序排列,并计算每个训练样点的高密度样点距离Δ(i),其中,所述Δ(i)采用如下计算模型获如下:
[0131]
[0132] S218根据S216和S217得到的每个训练样点的局部密度Rho(i)和高密度样点距离Δ(i),计算每个训练样点的决策值γ(i),其中,所述γ(i)采用如下计算模型获取:
[0133] γ(i)=Rho(i)*Δ(i)           (15)
[0134] S218对γ进行降序排列,并选取γ最大的前Kinitial个测试样点作为该训练样本的聚类中心样点
[0135] S219对剩余的非聚类中心样点的训练样点,按照各训练样点局部密度的降序进行遍历,将剩余的非聚类中心样点的训练样点分配至距其最近、且局部密度大于其局部密度的训练样点所在的类。
[0136] S22采用基于模糊聚类的方法,以上述聚类中心样点作为当前聚类中心样点,进行聚类中心样点个数的自组织调节,其具体步骤如下。
[0137] S211对于其中任意一个关键焊接参量的训练样本,执行以下操作:
[0138] S2111给各参数赋值,预期聚类个数Kexpected,类内样本点个数下限阈值 类内测试样点分布的距离标准差上限阈值θstd,两个聚类中心样点间的最小距离 每次迭代运算中允许合并的聚类中心样点的最多对数Lpair,允许的最多迭代次数I,模糊参数m,其中,Kinitial与Kexpected可以不相等,在聚类过程中,聚类中心样点的个数是可变的,变化范围为[Kexpected/2,2Kexpected],Lpair一般设为1,m一般设为2;
[0139] S2112以S218和S219得到的聚类中心样点 和聚类划分作为当前聚类中心样点和当前聚类划分,并记当前迭代次数为Inow;
[0140] S2113计算所有训练样本的初始隶属度uij,得到初始划分矩阵,其中,所述uij的计算模型如下:
[0141]
[0142] 其中,d(xi,ci)为:训练样点xj与聚类中心样点ci的欧式距离,d(xi,ck)为:训练样点xj与聚类中心样点ck的欧式距离,m为模糊参数
[0143] S2114针对每个类Si,i=1,2,...,Kinitial,判断类内训练样点的个数是否满足阈值,若不满足,则丢弃该类,并给当前聚类个数赋值Kinitial=Kinitial-1,且转至S2113重新进行划分,其中,所述判断模型如下:
[0144]
[0145] S2115针对每个类Si,i=1,2,...,Kinitial,修正聚类中心样点,其中,所述修正模型如下:
[0146]
[0147] 并更新所有训练样点的隶属度uij,得到更新划分矩阵;
[0148] S2116针对每个类Si,i=1,2,...,Kinitial,计算类内所有训练样点与其聚类中心样点间的模糊平均距离 其中,所述 的计算模型如下:
[0149]
[0150] S2117计算所有类的总平均距离 其中,所述 的计算模型如下:
[0151]
[0152] S2118判断是否进行合并、分类或迭代操作,若当前迭代次数Inow达到阈值I或目标函数值J收敛,则结束自组织调节,即聚类操作过程结束;若目标函数值J不收敛或当前迭代次数Inow未达到阈值I,当Kinitial≤Kexpected/2,转至分裂操作,当Kinitial≥2*Kexpected,同时Inow为奇数时,转至分裂操作,当Kexpected/2<Kinitial<2*Kexpected,同时Inow为偶数时转至合并操作,直至目标函数值J收敛或当前迭代次数Inow达到阈值I,其中,所述目标函数值J的计算模型如下:
[0153]
[0154] 进一步的,所述分裂操作包括:
[0155] 首先,针对每个类Si,i=1,2,...,Kinitial,计算该类的标准差σ,所述标准差σ的计算模型如下:
[0156]
[0157] 其中,xj为训练样点,ci为第i个聚类中心样点。
[0158] 然后,针对每个类Si,i=1,2,...,Kinitial,找出最大的σmax;
[0159] 最后,针对每个类Si,i=1,2,...,Kinitial,判断最大的σmax是否满足σmax>θstd,若满足,再继续判断是否满足分裂条件,若满足分裂条件,则进行分裂操作,其中,所述分裂条件判断模型如下:
[0160]
[0161] 所述分裂操作模型如下:
[0162]
[0163] 其中,所述合并操作具体包括以下步骤:
[0164] 首先,计算所有聚类中心样点两两之间的距离Dpq,其中,所述Dpq采用的计算模型如下:
[0165] Dpq=d(cp,cq),p=1,2,...,Kinitial-1,q=2,3,...,Kinitial           (25)[0166] 其中,cp为:第p个聚类中心样点,cq为第q个聚类中心样点;
[0167] 然后,对于满足 的Dpq,挑选出来并进行升序排列;
[0168] 最后,对于前Lpair个Dpq,进行合并操作,其中,所述合并操作采用公式(26),所述公式(26)如下:
[0169]
[0170] 其中,∑Upjk,∑Uqjk为第k对待合并的聚类中心样点cp、cq对应类的类内样本个数,Cpk,Cqk为第k对待合并的聚类中心样点cp、cq。
[0171] S2118当前迭代次数Inow=Inow+1,转至S211循环操作,直至完成聚类中心样点个数的自组织调节。
[0172] S23根据聚类结果及最大隶属度原则得到关联规则挖掘的划分区间。
[0173] S231根据聚类完成的最后一次得到的聚类中心样点 和训练样点的隶属度划分矩阵u,遵循最大隶属度原则,将训练样点聚成Kfinal个类;
[0174] S232针对每个类,取出其中的最小值和最大值,分别作为此类相应区间的左、右端点,完成将数值型属性离散化成若干个区间。
[0175] 可见,聚类个数不固定于预先给定的,而是在聚类过程中随着迭代不断改变,最终得到能够有效体现数据的实际分布情况的聚类个数。所述基于密度聚类与模糊聚类结合的自组织聚类方法进行离散化得到划分区间,结合了聚类中心避免随机选取与聚类个数自组织确定的优点,能够提高属性区间划分的准确性,为后续关联规则的挖掘奠定基础。
[0176] 其中,所述步骤S3的具体包括以下步骤:
[0177] S31根据划分区间将对应区间内的训练样点映射为布尔型数据;
[0178] 具体而言,把划分的各区间依次取为布尔型属性,然后依次读取所有训练样本内的训练样点,针对每个区间,判断训练样点取值是否落在区间中,若是则取1,反之取0,从而转换得到布尔型属性数据集。
[0179] S31采用Apriori算法提取工艺参数及测量信息与焊接质量之间的频繁项集,挖掘焊接参量与焊接质量之间的关联规则,具体而言,
[0180] S311给各参数赋值,支持度阈值MinSupp,置信度阈值MinConf;
[0181] S312依次扫描各关键焊接参量的各个区间的布尔型数据以及焊接质量的布尔型数据,得到每个属性,作为候选1项集C1,当前迭代次数为k=1;
[0182] S313迭代挖掘频繁k项集,直至得到最大项频繁集,其中,所述迭代挖掘频繁k项集包括:
[0183] 针对每次迭代k,执行以下操作:
[0184] 首选,依次扫描各关键焊接参量的各个区间的布尔型数据以及焊接质量的布尔型数据,计算候选k项集Ck的支持度,其中,所述支持度采用的计算模型如下:
[0185]
[0186] 其次,比较候选k项集Ck与支持度阈值MinSupp,去除支持度低于阈值的候选k项集,得到频繁k项集Lk,即,若频繁k项集的支持度大于支持度阈值,且该频繁k项集中包括焊接质量,则进入下一步,继续进行迭代,并记当前迭代次数为k,k≥1,否则,舍弃该布尔型数据;
[0187] 最后,两两连接频繁k项集生成候选k+1项集。
[0188] S314针对每个频繁项集Z,找出其所有非空子集X,计算候选规则的置信度,其中,所述置信度的计算模型如下:
[0189]
[0190] 其中,Z=X+Y。
[0191] S315对于后件为焊接质量且置信度满足置信度阈值MinConf的候选规则,生成强关联规则 即生成焊接参数量化关联规则。
[0192] 在本发明中,将新的焊接信息与挖掘的量化焊接参数关联规则进行匹配,以预测焊接质量类别,其具体包括以下步骤:
[0193] S41获取新的焊接信息,与挖掘得到的关联规则匹配,预测焊接质量类别。
[0194] 其中,所述获取新的焊接信息,与挖掘得到的关联规则匹配,预测焊接质量类别包括:
[0195] 针对每条新的焊接数据记录,执行以下操作,其中:
[0196] S411读取新的焊接数据记录;
[0197] S412将新的焊接信息的数值型数据作为测试样点,依次判断测试样点所属的关键焊接参量,接着判断该测试样点落在该关键焊接参量的哪个划分区间,并据此将新的焊接信息的测试样点映射成布尔型数据;
[0198] S413将步骤S412获取的布尔型数据与上述挖掘得到的量化焊接参数关联规则进行匹配,从而预测新的焊接的质量类别。
[0199] 本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈