首页 / 专利库 / 电脑编程 / 算法 / 电连接器智能统型方法

电连接器智能统型方法

阅读:3发布:2020-05-29

专利汇可以提供电连接器智能统型方法专利检索,专利查询,专利分析的服务。并且本 发明 的 电连接器 智能统型方法包括:1)获取已有的电连接器业务数据;2)获取已有的电连接器失效数据;3)根据统型要求对电连接器数据进行清洗;4)由清洗后的电连接器数据形成电连接器的 训练数据 集以及测试数据集;5)利用训练数据集构建电连接器统型 决策树 ;6)对电连接器统型决策树 剪枝 ;7)通过剪枝后的电连接器统型决策树对测试数据集中的数据进行分类;8)依据步骤7)分类结果形成电连接器统型表,比对该电连接器统型表与人工统型结果,若比对结果满足要求,即利用步骤5)构建的电连接器统型决策树进行电连接器智能统型。本发明解决电连接器统型依赖领域专家人工处理的问题。,下面是电连接器智能统型方法专利的具体信息内容。

1.电连接器智能统型方法,其特征在于,包括:
1)获取已有的电连接器业务数据;
2)获取已有的电连接器失效数据;
3)根据统型要求对电连接器数据进行清洗;
所述电连接器数包括步骤1)获取的电连接器业务数据和步骤2)获取的电连接器失效数据;
4)由清洗后的电连接器数据形成电连接器的训练数据集以及测试数据集;
5)利用训练数据集构建电连接器统型决策树
6)对电连接器统型决策树剪枝
7)通过剪枝后的电连接器统型决策树对测试数据集中的数据进行分类;
8)依据步骤7)分类结果形成电连接器统型表,比对该电连接器统型表与人工统型结果,若比对结果满足要求,即利用步骤5)构建的电连接器统型决策树进行电连接器智能统型。
2.如权利要求1所述的电连接器智能统型方法,其特征在于,从信息系统中集成已有的电连接器业务数据,所述电连接器业务数据包括电连接器基本属性数据、业务委托数据、检测流程数据和检测结果数据;从网站下载电子元器件失效分析汇总表,解析该汇总表获取所述已有的电连接器失效数据。
3.如权利要求1所述的电连接器智能统型方法,其特征在于,所述步骤3)中,对应用领域、委托单位、生产单位、进口/国产、三层分类、电连接器附件、低频电连接器、射频电连接器属性进行清洗。
4.如权利要求1所述的电连接器智能统型方法,其特征在于,所述步骤4)中,以清洗后的电连接器数据作为决策树算法的原始数据集,并给每一个电连接器添加标记,不符合质量要求的电连接器标记为不合格,符合质量要求的电连接器标记为合格;对标记后的数据集进行划分,分为训练数据集及测试数据集,训练数据集的数据量大于测试数据集的数据量。
5.如权利要求1所述的电连接器智能统型方法,其特征在于,所述步骤5)包括:
5-1)以电连接器的属性建立决策树候选属性集;
5-2)从候选属性集中选择最具有分类能的候选属性作为当前决策结点的分裂依据,该候选属性也称测试属性;
5-3)根据电连接器测试属性取值的不同,将训练数据集划分为若干子集;
重复步骤5-2)和步骤5-3),直到最后的子集符合下列情况之一,停止迭代
(A)子集中的数据都属于同一类,余下的候选属性无法划分该子集;
(B)该子集是遍历了所有候选属性得到的;
(C)子集中的所有剩余候选属性取值完全相同,己不能根据这些候选属性进一步进行子集划分;
5-4)确定电连接器决策树叶结点的类别并进行标识。
6.如权利要求5所述的电连接器智能统型方法,其特征在于,所述步骤5-1)中,候选属性集包括应用领域、委托单位、生产单位、进口/国产、三层分类、电连接器附件、低频电连接器、射频电连接器、失效地点、失效阶段、失效数量、失效模式、分析结论、批次性不合格档数、批次性不合格数量、个别不合格档数和个别不合格数量。
7.如权利要求5所述的电连接器智能统型方法,其特征在于,所述步骤5-2)中,先计算各个候选属性的信息增益比,选择信息增益比最大的候选属性作为当前决策结点的分裂依据。
8.如权利要求5所述的电连接器智能统型方法,其特征在于,所述步骤5-4)中,对于步骤5-3)基于(A)停止迭代的情况,叶结点根据电连接器数据所属类别进行标识;对于步骤5-
3)基于(B)和(C)停止迭代的情况,叶结点以数据记录个数最多的类别进行类别标识。
9.如权利要求1所述的电连接器智能统型方法,其特征在于,所述步骤7)包括:
7-1)将测试数据集表达成和训练数据集同样的形式;
7-2)遍历整个电连接器统型决策树,设当前遍历节点为t;
7-3)将测试样本对应特征值与之比较,然后根据结点分裂的标准,决定下个节点位于当前遍历节点t的左侧还是右侧;
7-4)递归执行7-3),直到t为叶结点;
测试样本的类别为叶结点t代表的类别。

说明书全文

电连接器智能统型方法

技术领域

[0001] 本发明涉及大数据人工智能技术领域,具体涉及一种电连接器智能统型方法。

背景技术

[0002] 现有技术中,电连接器统型依赖领域专家人工处理,效率低、可靠性差。
[0003] 近年来,大数据技术已经渗透到社会生产生活的各个方面,成为促进经济社会转型的支柱量,大数据的发展和普及为社会各行业中新业态的形成奠定了技术基础。大数据技术体系涵盖了大量的核心技术,如:大数据采集技术,对各种来源的结构化和非结构化海量数据进行采集;数据预处理技术,包括技术及业务数据预处理,前者指对采集到的原始数据进行“清洗、填补、平滑、合并、规格化、一致性检验”等操作,以提高数据的质量,后者是根据业务领域知识,对数据进行预处理,使其符合数据分析要求,为后期分析奠定基础;数据分析挖掘,从可视化分析、数据挖掘算法、预测性分析、语义引擎等方面,对杂乱无章的数据,进行萃取、提炼和分析过程。
[0004] 人工智能技术现已经广泛应用于各个领域,典型应用场景包括:人脸识别(安防领域)、人机交互(工程应用)、文本识别(舆情处理)等。电连接器智能统型中需要应用机器学习算法(决策树算法)来自动判读电连接器质量及使用情况,从而实现电连接器的智能统型。决策树可看作是一棵树型的预测模型,树的根结点是整个数据集合空间,每个分枝结点是一个分裂问题,它是对一个单一属性的测试,该测试将数据集合空间分割成两个或更多,每个叶结点是带有分类的数据分割。从决策树的根结点到叶结点的一条路径就形成了对相应对象的类别预测。决策树算法的核心问题是选取测试属性和决策树剪枝
[0005] 决策树生成指由训练数据集生成决策树的过程,基本步骤包括:
[0006] ①选择合适的属性集作为决策树候选属性集;
[0007] ②在候选属性集中选择最有分类能力的属性作为当前决策结点的分裂依据,结点上被选中的候选属性也称为测试属性;
[0008] ③根据当前决策结点测试属性取值的不同,将训练数据集划分为若干子集。并针对每一个子集,重复进行②、③两个步骤,直到最后的子集不可在划分;
[0009] ④确定叶结点的类别并进行标识,生成决策树。
[0010] 现有的决策树算法在文本分类、数据聚类、图像识别等领域已有广泛的应用,但在电连接器智能统型领域尚未见到上述应用,且电连接器的数据结构并不能直接满足决策树算法的相关要求,因此需要对现有的决策树算法进行较大幅度的改进,使其支持电连接器智能统型。

发明内容

[0011] 本发明的目的在于提供一种电连接器智能统型方法,解决电连接器统型依赖领域专家人工处理的问题。
[0012] 为了达到上述的目的,本发明提供一种电连接器智能统型方法,包括:
[0013] 1)获取已有的电连接器业务数据;
[0014] 2)获取已有的电连接器失效数据;
[0015] 3)根据统型要求对电连接器数据进行清洗;
[0016] 所述电连接器数包括步骤1)获取的电连接器业务数据和步骤2)获取的电连接器失效数据;
[0017] 4)由清洗后的电连接器数据形成电连接器的训练数据集以及测试数据集;
[0018] 5)利用训练数据集构建电连接器统型决策树;
[0019] 6)对电连接器统型决策树剪枝;
[0020] 7)通过剪枝后的电连接器统型决策树对测试数据集中的数据进行分类;
[0021] 8)依据步骤7)分类结果形成电连接器统型表,比对该电连接器统型表与人工统型结果,若比对结果满足要求,即利用步骤5)构建的电连接器统型决策树进行电连接器智能统型。
[0022] 与现有技术相比,本发明的有益技术效果是:
[0023] 本发明基于大数据技术对已有的电连接器数据进行集成、清洗,并对其中冗余和描述不一致数据进行整合,最后基于决策树算法实现自动统型,提高了工作效率和统型可靠性。附图说明
[0024] 本发明的电连接器智能统型方法由以下的实施例及附图给出。
[0025] 图1所示为本发明较佳实施例的电连接器智能统型方法的流程图

具体实施方式

[0026] 以下将结合图1对本发明的电连接器智能统型方法作进一步的详细描述。
[0027] 本发明中统型包括两层含义:技术层面——对电连接器中型号规格、委托单位等描述不一致的参数或属性进行统一数据清洗与整理;管理层面——根据电连接的使用情况、质量情况、供应商情况等,将部分不符合质量要求的电连接器从合格目录中去除,确保产品用电连接器的质量。
[0028] 图1所示为本发明较佳实施例的电连接器智能统型方法的流程图。
[0029] 本实施例的电连接器智能统型方法包括:
[0030] 1)获取已有的电连接器业务数据
[0031] 从信息系统中集成已有的电连接器业务数据
[0032] 本实施例从科研生产管理系统中集成已有的电连接器业务数据,包括电连接器基本属性数据、业务委托数据、检测流程数据、检测结果数据等;该科研生产管理系统主要是结构化数据(oracle),通过odbc驱动从oracle数据库中获取相关数据,并保存到电连接器数据仓库中;
[0033] 2)获取已有的电连接器失效数据
[0034] 本实施例从某科研单位网站下载电子元器件失效分析汇总表,该汇总表保存方式为excel格式,需要通过Python语言编写解析工具,然后将电连接器的失效数据提取出来,再集成保存到电连接器数据仓库中;
[0035] 3)根据统型要求对电连接器数据进行清洗
[0036] 所述电连接器数包括步骤1)获取的电连接器业务数据和步骤2)获取的电连接器失效数据;清洗包括包括对委托单位、规格型号、领域等属性的清洗;
[0037] 本实施例根据电连接器统型的要求对电连接器数据进行清洗,主要包括对应用领域、委托单位、生产单位、进口/国产、三层分类、电连接器附件、低频电连接器、射频电连接器等属性进行清洗;清洗完成后即可实现电连接器的技术统型;
[0038] 4)由清洗后的电连接器数据形成电连接器的训练数据集以及测试数据集[0039] 本实施例以清洗后的电连接器数据作为决策树算法的原始数据集,并给每一个电连接器添加标记,不符合质量要求的电连接器标记为不合格,符合质量要求的电连接器标记为合格;对标记后的数据集进行划分,分为训练数据集及测试数据集,两者数据量的比例为5:1;
[0040] 5)构建电连接器统型决策树
[0041] 5-1)以电连接器的属性建立决策树候选属性集;
[0042] 本实施例候选属性集包括应用领域、委托单位、生产单位、进口/国产、三层分类、电连接器附件、低频电连接器、射频电连接器、失效地点、失效阶段、失效数量、失效模式、分析结论、批次性不合格档数、批次性不合格数量、个别不合格档数、个别不合格数量等属性;
[0043] 5-2)从候选属性集中选择最具有分类能力的候选属性作为当前决策结点的分裂依据,该候选属性也称测试属性;
[0044] 本实施例先计算各个候选属性的信息增益比,选择信息增益比最大的候选属性(测试属性)作为当前决策结点的分裂依据;
[0045] 5-3)根据电连接器测试属性取值的不同,将训练数据集划分为若干子集;重复步骤5-2)和步骤5-3),直到最后的子集符合下列情况之一,停止迭代
[0046] (A)子集中的数据都属于同一类,余下的候选属性无法划分该子集;
[0047] (B)该子集是遍历了所有候选属性得到的;
[0048] (C)子集中的所有剩余候选属性取值完全相同,己不能根据这些候选属性进一步进行子集划分;
[0049] 5-4)确定电连接器决策树叶结点的类别并进行标识;
[0050] 对于步骤5-3)基于(A)停止迭代的情况,叶结点根据电连接器数据所属类别进行标识;对于步骤5-3)基于(B)和(C)停止迭代的情况,叶结点以数据记录个数最多的类别进行类别标识;
[0051] 6)对电连接器统型决策树剪枝
[0052] 本实施例使用事后剪枝(postpruning)技术,允许树充分生长,然后修剪掉多余的树枝;被修剪(分枝)的结点就成为一个叶结点,并将其标记为它所包含数据中类别个数最多的类别;
[0053] 7)通过剪枝后的电连接器统型决策树对测试数据集中的数据进行分类[0054] 7-1)将测试数据集表达成和训练数据集同样的形式;
[0055] 7-2)遍历整个电连接器统型决策树,设当前遍历节点为t;
[0056] 首先选择决策树根结点为t;
[0057] 7-3)将测试样本(即测试数据)对应特征值与之(当前遍历节点)比较,然后根据结点分裂的标准,决定下个节点位于当前遍历节点t的左侧还是右侧;
[0058] 7-4)递归执行7-3),直到t为叶结点;
[0059] 测试样本的类别为叶结点t代表的类别;
[0060] 8)依据步骤7)分类结果形成电连接器统型表,比对该电连接器统型表与人工统型结果
[0061] 若该电连接器统型表与人工统型结果比较相符,表明步骤5)构建的电连接器统型决策树正确,该电连接器统型决策树可用于电连接器智能统型;
[0062] 所述电连接器统型表与人工统型结果相近度达到92%,就能认为两者一致性很高。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈