首页 / 专利库 / 专利权 / 专利合作条约 / 第I章 / 受理局 / 形式要求 / 缺陷 / 一种重复缺陷综合查找方法

一种重复缺陷综合查找方法

阅读:749发布:2021-04-14

专利汇可以提供一种重复缺陷综合查找方法专利检索,专利查询,专利分析的服务。并且本 发明 提供的重复 缺陷 综合查找方法采用关键字查找、描述查找、设备 位置 及缺陷类型查找三种主要的查找方法,可以全面综合的进行重复缺陷的查找判别,同时以上三种方法均可将查找到的重复缺陷相似度用百分比进行量化,且还能按一定比例,将三种查找方式得到的相似度结合起来得到综合相似度,从而能够客观的评价重复缺陷的相似度。,下面是一种重复缺陷综合查找方法专利的具体信息内容。

1.一种重复缺陷综合查找方法,其特征在于:包括以下步骤:
S1.从生产管理数据库中采集所有N条完整缺陷数据的N个部分内容,将所述N个部分内容放入以条为单位的缺陷数据集合Qd中;
所述采集是从1至N逐条实现的,即共实现了N次子采集,每次子采集采集1条完整缺陷数据的部分内容,所述1条完整缺陷数据的部分内容仅为重复缺陷综合查找所需的关键字段,所述的所需的关键字段由缺陷单号、描述、位置、缺陷类型和问题代码组成,则缺陷数据集合Qd中存在N条仅分别由缺陷单号、描述、位置、缺陷类型和问题代码组成的缺陷数据;
S2.设定作为查找基准的缺陷单号Qn,并在缺陷数据集合Qd中提取出缺陷单号为Qn的缺陷数据Qnd,将缺陷数据Qnd作为基准缺陷数据,1≤n≤N;
S3设定p个关键字K1、K2……Kp,2≤p≤5;
S4.从基准缺陷数据Qnd中提取出以下关键字段:描述Qndm、位置Qndw、缺陷类型Qndl和问题代码Qndd;
S5.从缺陷数据集合Qd中逐条提取除基准缺陷数据Qnd以外的其他缺陷数据与基准缺陷数据Qnd进行比较,从而进行重复缺陷综合查找,其具体过程如步骤S6~步骤S934所述:
S6.设置i=1;
S7.比较i是否与n相等,如果不等,按顺序进行以下步骤,如果相等跳转到步骤S11;
S8.提取缺陷数据集合Qd中的第i条缺陷数据为缺陷数据Qid;
S9.从缺陷数据Qid中提取出以下关键字段:描述Qidm、位置Qidw、缺陷类型Qidl、问题代码Qidd;然后分别按描述、关键字、设备位置及缺陷类型进行并行的重复缺陷查找:
(1)按描述进行重复缺陷查找:
S911.计算描述Qndm的字数Zn;
S912.设r=1,描述相似度Xm=100;
S913.取描述Qndm的第r位和第r+1位的两个字组成一个二字元词C;
S914.比较C是否包含在描述Qidm中,若不包含则Xm=Xm-(Xm÷(Zn-1));
S915.r=r+1;
S916.若r小于Zn,则跳到步骤S913,否则跳到步骤S917;
S917.判断Xm是否大于槛百分比M,大于则将缺陷数据Qid判定为重复缺陷;
(2)按关键字进行重复缺陷查找:
S921.设s=1,关键字匹配数量q=0,关键字相似度Xg=0;
S922.取第s个关键字Ks;
S923.比较判断关键字Ks是否包含在描述Qidm中,若包含则令q=q+1,Xg=Xg+100÷p,p为关键字的数量;
S924.s=s+1;
S925.若s小于等于p,则跳至步骤S922,否则跳至步骤S926;
S926.判断关键字相似度Xg是否大于门槛百分比M,q是否大于等于2,如果Xg大于门槛百分比M,或者q大于等于2,则将缺陷数据Qid判定为重复缺陷;
(3)按设备位置及缺陷类型进行重复缺陷查找:
S931.设置设备位置及缺陷类型相似度Xw=0,比较位置Qidw中根位置以下的其他位置与位置Qndw中根位置以下的其他位置是否相同,相同则Xw=Xw+50;
S932.比较缺陷类型Qidl与缺陷类型Qndl是否相同,相同则Xw=Xw+25;
S933.比较问题代码Qidd与问题代码Qndd是否相同,相同则Xw=Xw+25;
S934.判断Xw是否大于门槛百分比M,大于则将缺陷数据Qid判定为重复缺陷;
S10.按以上(1)、(2)、(3)三种方法中的任一种方法判定缺陷数据Qid为重复缺陷,则进行综合相似度Xz计算,否则,跳至步骤S11;
Xz=50%×Xm+35%×Xg+15%×Xw;
S11判断i是否小于N,若小于N则令i=i+1并返回步骤S7;若i大于等于N则跳至步骤S12;
S12.将查找到的重复缺陷按综合相似度从大到小进行排序,然后结束查找。

说明书全文

一种重复缺陷综合查找方法

技术领域

[0001] 本发明涉及工业领域,更具体地,涉及一种重复缺陷综合查找方法。

背景技术

[0002] 工业领域为了分析及管理设备的缺陷,需要对设备重复发生的缺陷进行查找和统计。例如设备甲发生过故障特征类型为a的缺陷,又再次出现同类型a的缺陷,即被认为是重复缺陷。或者相似的设备乙也出现了a型缺陷,也可被认为是重复缺陷。故重复缺陷的可定义为“相同类型的设备出现相同类型的缺陷”。重复缺陷查找工作就是对大量的设备缺陷数据进行甄别,把具备某一相同或相似故障特征的同类设备的重复性发生的缺陷筛选出来。
[0003] 现有的重复缺陷查找方法一般是先从设备的生产管理数据库中下载缺陷数据列表,然后选定某一条设备缺陷为查找基准,靠人工逐条比对,或者采用excel等电子表格工具,用搜索-查找关键词的方法对缺陷描述进行初步筛选,然后再在找到的包含关键词的若干条缺陷中再去进一步人工判断是否确实为重复缺陷。
[0004] 但是,上述方法在实际操作的时候却存在这以下缺陷:
[0005] 1、如果依靠人工逐条比对,一是严重依赖查找人的主观查找经验和判断,二是当缺陷数量多时,例如上万条,工作量过于巨大;
[0006] 2、采用电子表格,用关键词搜索的方式,一般只能同时查某一个关键词,关键词选择不当,可能造成找到大量的无效缺陷或根本找不到重复缺陷。
[0007] 3、当找到了多条重复缺陷时,无法对其相似程度进行定量的分析,只能主观定性其为相似的重复缺陷,但具体相似到何种程度,没有具体数值。
[0008] 4、当缺陷发生在同一位置的设备,且缺陷类别也相同,只是缺陷描述不同时,如果只靠缺陷描述判断其重复性,则很可能被漏判。

发明内容

[0009] 针对上述缺点,本发明提供的方法采用关键字查找、描述查找、设备位置及缺陷类型查找三种主要的的查找方法,可以全面综合的进行重复缺陷的查找判别,同时以上三种方法均可将查找到的重复缺陷相似度用百分比进行量化,且还能按一定比例,将三种查找方式得到的相似度结合起来得到综合相似度,从而能够客观的评价重复缺陷的相似度。
[0010] 为实现以上发明目的,采用的技术方案是:
[0011] 一种重复缺陷综合查找方法,其特征在于:包括以下步骤:
[0012] S1.从生产管理数据库中采集所有N条完整缺陷数据的N个部分内容,将所述N个部分内容放入以条为单位的缺陷数据集合Qd中;
[0013] 所述采集是从1至N逐条实现的,即共实现了N次子采集,每次子采集采集1条完整缺陷数据的部分内容,所述1条完整缺陷数据的部分内容仅为重复缺陷综合查找所需的关键字段,所述的所需的关键字段由缺陷单号、描述、位置、缺陷类型和问题代码组成,则缺陷数据集合Qd中存在N条仅分别由缺陷单号、描述、位置、缺陷类型和问题代码组成的缺陷数据;
[0014] S2.设定作为查找基准的缺陷单号Qn,并在缺陷数据集合Qd中提取出缺陷单号为Qn的缺陷数据Qnd,将缺陷数据Qnd作为基准缺陷数据,1≤n≤N;
[0015] S3设定p个关键字K1、K2……Kp,2≤p≤5;
[0016] S4.从基准缺陷数据Qnd中提取出以下关键字段:描述Qndm、位置Qndw、缺陷类型Qndl和问题代码Qndd;
[0017] S5.从缺陷数据集合Qd中逐条提取除基准缺陷数据Qnd以外的其他缺陷数据与基准缺陷数据Qnd进行比较,从而进行重复缺陷综合查找,其具体过程如步骤S6~步骤S934所述:
[0018] S6.设置i=1;
[0019] S7.比较i是否与n相等,如果不等,按顺序进行以下步骤,如果相等跳转到步骤S11;
[0020] S8.提取缺陷数据集合Qd中的第i条缺陷数据为缺陷数据Qid;
[0021] S9.从缺陷数据Qid中提取出以下关键字段:描述Qidm、位置Qidw、缺陷类型Qidl、问题代码Qidd;然后分别按描述、关键字、设备位置及缺陷类型进行并行的重复缺陷查找:
[0022] (1)按描述进行重复缺陷查找:
[0023] S911.计算描述Qndm的字数Zn;
[0024] S912.设r=1,描述相似度Xm=100;
[0025] S913.取描述Qndm的第r位和第r+1位的两个字组成一个二字元词C;
[0026] S914.比较C是否包含在描述Qidm中,若不包含则Xm=Xm-(Xm÷(Zn-1));
[0027] S915.r=r+1;
[0028] S916.若r小于Zn,则跳到步骤S913,否则跳到步骤S917;
[0029] S917.判断Xm是否大于槛百分比M,大于则将缺陷数据Qid判定为重复缺陷;
[0030] (2)按关键字进行重复缺陷查找:
[0031] S921.设s=1,关键字匹配数量q=0,关键字相似度Xg=0;
[0032] S922.取第s个关键字Ks;
[0033] S923.比较判断关键字Ks是否包含在描述Qidm中,若包含则令q=q+1,Xg=Xg+100÷p,p为关键字的数量;
[0034] S924.s=s+1;
[0035] S925.若s小于等于p,则跳至步骤S922,否则跳至步骤S926;
[0036] S926.判断关键字相似度Xg是否大于门槛百分比M,q是否大于等于2,如果Xg大于门槛百分比M,或者q大于等于2,则将缺陷数据Qid判定为重复缺陷;
[0037] (3)按设备位置及缺陷类型进行重复缺陷查找:
[0038] S931.设置设备位置及缺陷类型相似度Xw=0,比较位置Qidw中根位置以下的其他位置与位置Qndw中根位置以下的其他位置是否相同,相同则Xw=Xw+50;
[0039] S932.比较缺陷类型Qidl与缺陷类型Qndl是否相同,相同则Xw=Xw+25;
[0040] S933.比较问题代码Qidd与问题代码Qndd是否相同,相同则Xw=Xw+25;
[0041] S934.判断Xw是否大于门槛百分比M,大于则将缺陷数据Qid判定为重复缺陷;
[0042] S10.按以上(1)、(2)、(3)三种方法中的任一种方法判定缺陷数据Qid为重复缺陷,则进行综合相似度Xz计算,否则,跳至步骤S11;
[0043] Xz=50%×Xm+35%×Xg+15%×Xw;
[0044] S11判断i是否小于N,若小于N则令i=i+1并返回步骤S7;若i大于等于N则跳至步骤S12;
[0045] S12.将查找到的重复缺陷按综合相似度从大到小进行排序,然后结束查找。与现有技术相比,本发明的有益效果是:
[0046] 1、同时采用关键字查找、描述查找、设备位置及缺陷类型查找三种主要的的查找方法,可以全面综合的进行重复缺陷的查找判别。
[0047] 2、采用特殊的二字元匹配综合描述查找方法,对缺陷描述的差异、相似性进行定量分析,查找快速且精确。
[0048] 3、采用多重关键字查找方法,该方法不依赖于单一的关键字,可采用多达5个关键字进行逻辑组合查找,关键字查找的准确性和命中率大幅提升。
[0049] 4、采用设备位置及缺陷类型的结合查找法,从重复缺陷的本质,即同类设备发生同类故障,进行查找,避免了只依靠缺陷描述的单一性。
[0050] 5、以上三种方法均可将查找到的重复缺陷相似度用百分比进行量化,且还能按一定比例,将三种查找方式得到的相似度结合起来得到综合相似度,能客观的评价重复缺陷的相似度。附图说明
[0051] 图1为综合查找方法的流程示意图。

具体实施方式

[0052] 附图仅用于示例性说明,不能理解为对本专利的限制;
[0053] 以下结合附图和实施例对本发明做进一步的阐述。
[0054] 实施例1
[0055] 如图1所示,重复缺陷综合查找方法包括以下步骤:
[0056] 一种重复缺陷综合查找方法,其特征在于:包括以下步骤:
[0057] S1.从生产管理数据库中采集所有N条完整缺陷数据的N个部分内容,将所述N个部分内容放入以条为单位的缺陷数据集合Qd中;
[0058] 所述采集是从1至N逐条实现的,即共实现了N次子采集,每次子采集采集1条完整缺陷数据的部分内容,所述1条完整缺陷数据的部分内容仅为重复缺陷综合查找所需的关键字段,所述的所需的关键字段由缺陷单号、描述、位置、缺陷类型和问题代码组成,则缺陷数据集合Qd中存在N条仅分别由缺陷单号、描述、位置、缺陷类型和问题代码组成的缺陷数据;
[0059] S2.设定作为查找基准的缺陷单号Qn,并在缺陷数据集合Qd中提取出缺陷单号为Qn的缺陷数据Qnd,将缺陷数据Qnd作为基准缺陷数据,1≤n≤N;
[0060] S3设定p个关键字K1、K2……Kp,2≤p≤5;
[0061] S4.从基准缺陷数据Qnd中提取出以下关键字段:描述Qndm、位置Qndw、缺陷类型Qndl和问题代码Qndd;
[0062] S5.从缺陷数据集合Qd中逐条提取除基准缺陷数据Qnd以外的其他缺陷数据与基准缺陷数据Qnd进行比较,从而进行重复缺陷综合查找,其具体过程如步骤S6~步骤S934所述:
[0063] S6.设置i=1;
[0064] S7.比较i是否与n相等,如果不等,按顺序进行以下步骤,如果相等跳转到步骤S11;
[0065] S8.提取缺陷数据集合Qd中的第i条缺陷数据为缺陷数据Qid;
[0066] S9.从缺陷数据Qid中提取出以下关键字段:描述Qidm、位置Qidw、缺陷类型Qidl、问题代码Qidd;然后分别按描述、关键字、设备位置及缺陷类型进行并行的重复缺陷查找:
[0067] (1)按描述进行重复缺陷查找:
[0068] S911.计算描述Qndm的字数Zn;
[0069] S912.设r=1,描述相似度Xm=100;
[0070] S913.取描述Qndm的第r位和第r+1位的两个字组成一个二字元词C;
[0071] S914.比较C是否包含在描述Qidm中,若不包含则Xm=Xm-(Xm÷(Zn-1));
[0072] S915.r=r+1;
[0073] S916.若r小于Zn,则跳到步骤S913,否则跳到步骤S917;
[0074] S917.判断Xm是否大于门槛百分比M,大于则将缺陷数据Qid判定为重复缺陷;
[0075] 例如:Qndm为“我是缺陷实例”,按以上方法可分解为“我是、是缺、缺陷、陷实、实例”5个二字元词,如Qidm为“我是缺陷的另一个例子”。那么其包含了Qndm中的“我是、是缺、缺陷”三个二字元词,相似度Xm=60>门槛50,Qid计为Qnd的重复缺陷。
[0076] (2)按关键字进行重复缺陷查找:
[0077] S921.设s=1,关键字匹配数量q=0,关键字相似度Xg=0;
[0078] S922.取第s个关键字Ks;
[0079] S923.比较判断关键字Ks是否包含在描述Qidm中,若包含则令q=q+1,Xg=Xg+100÷p,p为关键字的数量;
[0080] S924.s=s+1;
[0081] S925.若s小于等于p,则跳至步骤S922,否则跳至步骤S926;
[0082] S926.判断关键字相似度Xg是否大于门槛百分比M,q是否大于等于2,如果Xg大于门槛百分比M,或者q大于等于2,则将缺陷数据Qid判定为重复缺陷;
[0083] 例如,查找的关键字为“我”、“缺陷”、“实例”共三个关键字。Qidm为“它是缺陷实例”,则“缺陷”、“实例”两个关键字包含在Qidm中,q=2,Xg=66.6。
[0084] Xg>门槛50,q≥2,Qid计为Qnd的重复缺陷。
[0085] (3)按设备位置及缺陷类型进行重复缺陷查找:
[0086] S931.设置设备位置及缺陷类型相似度Xw=0,比较位置Qidw中根位置以下的其他位置与位置Qndw中根位置以下的其他位置是否相同,相同则Xw=Xw+50;
[0087] S932.比较缺陷类型Qidl与缺陷类型Qndl是否相同,相同则Xw=Xw+25;
[0088] S933.比较问题代码Qidd与问题代码Qndd是否相同,相同则Xw=Xw+25;
[0089] S934.判断Xw是否大于门槛百分比M,大于则将缺陷数据Qid判定为重复缺陷;
[0090] 例如:Qidw为“盘柜A门B”,Qndw为“盘柜B阀门B”,根位置分别为“盘柜A”、“盘柜B”但以下位置均为“阀门B”,故Qidw=Qndw。
[0091] Qidl为“阀门故障”,Qndl为“传感器故障”,Qidl≠Qndl。Qidd为“卡涩”,Qndd为“断裂”,Qidd≠Qndd。故Xw=50+0+0=50,不大于门槛50。则不计Qid为Qnd的重复缺陷。
[0092] S10.按以上(1)、(2)、(3)三种方法中的任一种方法判定缺陷数据Qid为重复缺陷,则进行综合相似度Xz计算,否则,跳至步骤S11;
[0093] Xz=50%×Xm+35%×Xg+15%×Xw;
[0094] 如Xm=60,Xg=66.6,Xw=50。Xm和Xg均可判出Qid为重复缺陷,则Qid的综合相似度Xz=50%×60+35%×66.6+15%×50=60.81
[0095] S11判断i是否小于N,若小于N则令i=i+1并返回步骤S7;若i大于等于N则跳至步骤S12;
[0096] S12.将查找到的重复缺陷按综合相似度从大到小进行排序,然后结束查找。
[0097] 显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈