首页 / 专利库 / 企业组织 / 术语学家 / 一种新的基于数据挖掘技术的智能冲压工艺设计方法

一种新的基于数据挖掘技术的智能冲压工艺设计方法

阅读:694发布:2020-05-18

专利汇可以提供一种新的基于数据挖掘技术的智能冲压工艺设计方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种新的基于 数据挖掘 技术的智能 冲压 工艺设计方法,涉及到数据挖掘、知识工程、冲压工艺等技术,属于多学科交叉领域。方法包括六个过程:过程一:建立支持本系统构建的统一的特征信息模型,过程二:建立关联性知识表达模型,过程三:构建用于数据挖掘建模的推理系统,过程四:研究数据挖掘模型评价技术,过程五:局部过程的智能化集成,过程六:系统的总体集成、测试、完善。本发明主要用于改造提升传统的冲压工艺设计方法,提高冲压工艺设计的准确性和效率。,下面是一种新的基于数据挖掘技术的智能冲压工艺设计方法专利的具体信息内容。

1.一种新的基于数据挖掘技术的智能冲压工艺设计方法,其特征在于,包括以下过程:
步骤一:建立支持本系统构建的统一的特征信息模型;研究当前基于数据挖掘的冲压工艺设计专家系统特征信息表达模型的基础上,研究融入KBE技术、本体技术所新增的特征信息,建立整个工艺设计过程完整、统一的特征概念定义;
步骤二:建立关联性知识表达模型;在分析冲压工艺设计中基于数据挖掘的CAD过程和基于数据挖掘的CAE过程所涉及的功能、数据、特征参数设置以及形状特征和工艺知识的因果关系的基础上,采用基于本体语义的知识表示法建立两个过程的关联性知识表达模型;
步骤三:构建用于数据挖掘建模的推理系统,包括以下步骤:
步骤3.1:设计任务的分解技术及确定用于挖掘的相关数据集;利用KBE技术的RBR实现形式完成将复杂任务分解成若干可执行性子任务,并确定该子任务相关的数据集;
步骤3.2:构建面向冲压工艺设计的基于本体语义的数据挖掘事例库:首先,从领域中收集丰富的词汇、术语,并将业内广泛认可的词汇、术语作为本体的概念,同时将本体概念分类为背景概念和结果概念;其次,分析领域内概念之间的相互联系,准确获取领域本体的各种关系;最后,将本体的所有概念通过它们之间的关系进行连接,形成一个树状网络结构,即是本体事例知识库的数据结构;
步骤3.3:确定数据挖掘建模子系统的知识推理方案:首先,确定系统总体检索方案,本项目采用知识导引和最近邻算法相结合的二级检索方案;其次,确定事例的相似度算法;最后,验证相似度算法的效果以及检索方案的效果;
步骤四:研究数据挖掘模型评价技术;研究数据挖掘模型的评价指标,构建准确、完备的评价指标体系;确定指标权重的计算方法以及指标量化值的计算方法;建立综合利用这些指标定量度量数据挖掘模型性能的方法;
步骤五:局部过程的智能化集成;此过程包含两个方面:一是基于智能数据挖掘技术和关联知识模型的初始设计过程集成,二是基于智能数据挖掘技术和关联知识模型的仿真反馈设计过程集成;
步骤六:系统的总体集成、测试、完善;该系统分为四层:用户界面层、功能模层、技术平台层、数据层。
2.根据权利要求1所述的一种新的基于数据挖掘技术的智能冲压工艺设计方法,其特征在于:所述的步骤一中的特征信息模型包括:零件特征信息模型、制造资源特征信息模型、工艺规划特征信息模型。
3.根据权利要求1所述的一种新的基于数据挖掘技术的智能冲压工艺设计方法,其特征在于:所述步骤六中的功能模块层包括6个基本的功能模块:知识检索模块、数据挖掘事例检索模块、数据挖掘事例修改模块、数据挖掘与知识发现模块、工艺知识学习模块和数据挖掘事例学习模块。

说明书全文

一种新的基于数据挖掘技术的智能冲压工艺设计方法

技术领域

[0001] 本方法(技术)涉及到数据挖掘、知识工程、冲压工艺等技术,属于多学科交叉领域,主要用于改造提升传统的冲压工艺设计方法,提高冲压工艺设计的准确性和效率。

背景技术

[0002] 随着信息技术的飞速发展,CAPP(Computer Aided Process Planning,计算机辅助工艺规划)在制造企业中的应用越来越广泛,越来越深入,新的知识技术例如KBE(Knowledge Based Engineering,基于知识的工程)技术、数据挖掘技术等和新的信息技术例如本体技术、网络技术等不断涌现和迅猛发展。在全球经济一体化趋势日益增强的背景下,各行各业迫切要求不断吸收利用新的知识技术、信息技术加快对传统产业的改造提升,实现传统产业的知识化,信息化以及智能化,从而在剧烈的全球竞争下立于不败之地。
[0003] 冲压技术作为工业支柱产业——制造业的一种重要产品加工方法,尤其迫切需要利用知识技术、信息技术改造提升传统手段与技术,实现高度智能化生产加工。即将专家的经验知识和专家人本身分开来,使其能够独立发挥决策作用,达到摆脱对工艺专家的依赖、便于工艺知识的继承和集成、拥有更强大解决问题能的目标。
[0004] 目前,数据挖掘技术已成为冲压件智能工艺设计研究的热点,国内外已进行大量研究及应用实践,也出了不少成果,数据挖掘技术已充分展示出其获取工艺知识的优越性:只要提供完备、准确、可靠的数据,数据挖掘技术就可以获取需要的知识,不但避免了对领域专家的严重依赖,而且获得的知识比传统的知识更优质,更容易和自动化系统衔接。因为这些知识是通过严格、科学的算法从数据(事物的现象)推理出的事物内在联系(知识本质),很精确,易于转化成量化知识,从而作为控制知识实现基于知识驱动的自动化工艺CAD设计;但是这些研究和应用实践也显示,数据挖掘技术在冲压件工艺设计领域的应用仍存在严重不足:冲压件工艺设计呈局部智能化状态,整体智能化、自动化程度仍然较低,导致系统准确性、效率以及解决问题的能力大大受限,距离学术界和工业所期待的目标尚有很大距离。具体表现在两个方面:
[0005] 第一、当前数据挖掘技术在冲压件工艺设计中的应用研究多是局部性应用研究,要么单独地将数据挖掘技术用于工艺设计数据的挖掘以完成初始工艺设计,要么单独地用于处理仿真数据以获取知识实现对初次设计的修正,没有将两个阶段的数据挖掘集成起来形成一个有机统一过程,从而造成系统智能化、自动化程度受限,进而影响二者有机协作,妨碍了工艺设计的准确性和效率的提高。
[0006] 第二、数据挖掘过程的进行依然强烈依靠经验丰富的专家的参与,不但妨碍了系统的智能化、自动化程度,而且严重削弱了系统解决问题的能力。发明内容
[0007] 针对冲压件工艺设计领域智能化、自动化程度较低,妨碍工艺设计的准确性和效率,同时削弱系统解决问题的能力等问题,本发明提出一种新的基于数据挖掘技术的智能冲压工艺设计方法。
[0008] 本发明采用的技术方案为:一种新的基于数据挖掘技术的智能冲压工艺设计方法,包括以下过程:
[0009] 过程一:建立支持本系统构建的统一的特征信息模型;
[0010] 研究当前基于数据挖掘的冲压工艺设计专家系统特征信息表达模型的基础上,研究融入KBE技术、本体技术所新增的特征信息,建立整个工艺设计过程完整、统一的特征概念定义。
[0011] 过程二:建立关联性知识表达模型;
[0012] 在分析冲压工艺设计中基于数据挖掘的CAD过程和基于数据挖掘的CAE过程所涉及的功能、数据、特征参数设置(对成形质量目标函数有影响的参数)以及形状特征和工艺知识的因果关系的基础上,采用基于本体语义的知识表示法建立两个过程的关联性知识表达模型。
[0013] 过程三:构建用于数据挖掘建模的推理系统;
[0014] 过程四:研究数据挖掘模型评价技术;
[0015] 研究数据挖掘模型的评价指标,构建准确、完备的评价指标体系;确定指标权重的计算方法以及指标量化值的计算方法;建立综合利用这些指标定量度量数据挖掘模型性能的方法。
[0016] 过程五:局部过程的智能化集成;
[0017] 此过程包含两个方面:一是基于智能数据挖掘技术和关联知识模型的初始设计过程集成,二是基于智能数据挖掘技术和关联知识模型的仿真反馈设计过程集成。
[0018] 过程六:系统的总体集成、测试、完善。
[0019] 系统分为四层:用户界面层、功能模层、技术平台层、数据层。
[0020] 进一步,所述的过程一中的特征信息模型包括:零件特征信息模型、制造资源特征信息模型、工艺规划特征信息模型。
[0021] 进一步,所述的过程三又分为三个步骤:
[0022] 步骤一:设计任务的分解技术及确定用于挖掘的相关数据集。利用KBE技术的RBR实现形式完成将复杂任务分解成若干可执行性子任务,并确定该子任务相关的数据集;
[0023] 步骤二:构建面向冲压工艺设计的基于本体语义的数据挖掘事例库:首先,从领域中收集丰富的词汇、术语,并将业内广泛认可的词汇、术语作为本体的概念,同时将本体概念分类为背景概念和结果概念;其次,分析领域内概念之间的相互联系,准确获取领域本体的各种关系;最后,将本体的所有概念通过它们之间的关系进行连接,形成一个树状网络结构,即是本体事例知识库的数据结构;
[0024] 步骤三:确定数据挖掘建模子系统的知识推理方案:首先,确定系统总体检索方案,本项目采用知识导引和最近邻算法相结合的二级检索方案;其次,确定事例的相似度算法;最后,验证相似度算法的效果以及检索方案的效果。
[0025] 进一步,所述过程六中的功能模块层包括6个基本的功能模块:知识检索模块、数据挖掘事例检索模块、数据挖掘事例修改模块、数据挖掘与知识发现模块、工艺知识学习模块和数据挖掘事例学习模块。
[0026] 本发明的有益效果为:显著提高冲压工艺设计过程的智能化、自动化程度,克服对设计者经验的依赖,大幅提高专家系统解决实际问题的能力以及设计质量和效率,极大地促进我国制造工业特别是冲压模具制造业的发展;另外,本发明大大降低数据挖掘技术的应用槛,使数据挖掘技术更易于和具体应用领域结合,从而促进其在各个领域广泛深入应用。附图说明
[0027] 图1一种新的基于数据挖掘技术的智能冲压工艺设计方法流程图
[0028] 图2零件特征信息模型;
[0029] 图3制造资源特征信息模型;
[0030] 图4加工工艺特征信息模型;
[0031] 图5基于本体的数据挖掘事例库;
[0032] 图6概念Ci′,Ci和leaves(Ci^)的关系;
[0033] 图7数据挖掘模型性能评估指标的本体结构体系;
[0034] 图8基于本体和CBR的数据挖掘模型评价过程伪代码;
[0035] 图9系统总体架构;
[0036] 图10知识检索模块;
[0037] 图11数据挖掘事例检索模块;
[0038] 图12数据挖掘事例修改模块;
[0039] 图13数据挖掘模块;
[0040] 图14工艺知识学习模块;
[0041] 图15数据挖掘事例学习模块。

具体实施方式

[0042] 下面结合附图和实施例对本发明作进一步说明。
[0043] 图1为本发明设计方法流程图,具体详述如下:
[0044] (1)建立支持本系统构建的统一的特征信息模型;
[0045] 研究当前基于数据挖掘的冲压工艺设计专家系统特征信息表达模型的基础上,研究融入KBE技术、本体技术所新增的特征信息,建立整个工艺设计过程完整、统一的特征概念定义。
[0046] 根据特征建模思想,通过特征提取技术,建立支持本系统建构的零件特征信息模型,制造资源特征信息模型,工艺规划特征信息模型。在每一个特征信息模型构建过程中,采用逐层分解策略将特征从抽象到具体逐级剖析表达。在零件特征信息模型中,比较抽象的特征如形状特征、精度特征、材料特征、性能特征等,这些抽象的特征可以具体分解成很多子特征,以此类推,如图2所示。同理,在制造资源特征信息模型中,比较抽象的特征是机床、夹具、量具、刀具等,这些抽象的特征可以具体分解成很多子特征,以此类推,如图3所示;在工艺规划特征信息模型中,比较抽象的特征是加工方法选择、加工设备选择、零件加工顺序、工步等,这些抽象的特征可以具体分解成很多子特征,以此类推,如图4所示。
[0047] (2)建立关联性知识表达模型;
[0048] 在分析冲压工艺设计中基于数据挖掘的CAD过程和基于数据挖掘的CAE过程所涉及的功能、数据、特征参数设置(对成形质量目标函数有影响的参数)以及形状特征和工艺知识的因果关系的基础上,采用基于本体语义的知识表示法建立两个过程的关联性知识表达模型。
[0049] (3)构建用于数据挖掘建模的推理系统;这一环节包括三步骤:
[0050] 步骤一:设计任务的分解技术及确定用于挖掘的相关数据集。利用KBE技术的RBR实现形式完成将复杂任务分解成若干可执行性子任务,并确定该子任务相关的数据集。
[0051] 步骤二:构建面向冲压工艺设计的基于本体语义的数据挖掘事例库:
[0052] 首先,从领域中收集丰富的词汇、术语,并将业内广泛认可的词汇、术语作为本体的概念,同时将本体概念分类为背景概念和结果概念;
[0053] 其次,分析领域内概念之间的相互联系,准确获取领域本体的各种关系;
[0054] 最后,将本体的所有概念通过它们之间的关系进行连接,形成一个树状网络结构,即是本体事例知识库的数据结构,概念越抽象,其位置越在树的顶端。树的最顶端是最抽象最笼统的概念“工艺规划数据挖掘事例”,最底端即树的末梢是最具体的概念例如材料“PS”、“PPS”等,在本体树形结构中,树叶部分(叶节点)的概念同时也是一个数据库的标签,里面可以存储相应概念的特征值。这些叶节点可以看做一个集合,而现实世界的每一个具体事例,实际就是对这组叶节点进行赋值,从而成为整个本体Case的一个实例,如图5所示。这样,将大量现实世界的实例的具体特征值存入对应的数据库就构成事例库,储存了领域知识。
[0055] 步骤三:确定数据挖掘建模子系统的知识推理方案:
[0056] 首先,确定系统总体检索方案,事例检索是利用检索信息从源事例库中检索并选择潜在可用的源事例,并对新事例与源事例之间的相似度做出合理评判,其核心技术包括检索策略和相似算法的设计与选择。通常采用的策略是最近邻法和知识导引法的结合。本发明采用知识导引和最近邻算法相结合的二级检索方案,第一级检索是基于本体的语义理解检索,其功能相当于知识导引法,首先将问题的解缩小到一个适当的解空间;第二级是利用最近邻算法的数值计算,并通过设置一定的阂值控制所返回的结果事例个数;如何访问本体事例库和语义相似度的计算是基于本体语义理解检索的两个核心环节,它决定着检索的成败与否。
[0057] 其次,确定事例的相似度算法;
[0058] 本发明构建的语义相似度算法如下:
[0059] 综合考虑ND(Node Distance)和IC(Information Content)相似度,以恰当的方式结合,能有效提高语义相似度计算准确性。在这一理念的启发下,本发明提出了新的ND-IC相似度计算法即W-IC-ND(Weighted Information Content and Node Distance)。假定概念簇C′=[C1′,C2′,...,Ci′,...,Cn′]来自于用户询问,概念簇C=[C1,C2,...,Ci,...,Cn]来自于匹配的本体词汇库。概念簇C′和C的总体相似度表示为SimIC-ND(C′,C)。为计算SimIC-ND(C′,C),首先计算这两组概念簇中每一个概念对(Ci′,Ci)的相似度,记为SimIC-ND(Ci′,Ci)。当计算SimIC-ND(Ci′,Ci)时,我们首先用IC相似度计算法计算,记为SimIC(Ci′,Ci),再用ND法计算,记为SimND(Ci′,Ci),最后再将二者加权求和。其详细过程描述如下:
[0060] 1)计算SimIC(Ci′,Ci)的值
[0061] 两个概念的IC相似度值指其拥有共同信息的程度。假定概念Ci^是概念Ci′和Ci的最近共同祖先。在本体结构中,所有来自概念Ci^的概念和分类(包括概念Ci^)定义为概念Ci^的叶,记作leaves(Ci^)。概念Ci′,Ci,Ci^和leaves(Ci^)的关系如图6所示。
[0062] 显然,一个概念的叶比单纯的一个概念包含更丰富和全面的语义内容,更能区分出它和别的概念的不同。这样,在一个领域本体内,一个概念叶更能精确定义一个概念。于是本发明用概念叶作为定义IC相似度的唯一指标。
[0063] 目前,IC相似度的值通过估计概念在文献集中出现的频率获得,根据信息理论中的理念,概念C的IC值能通过公式来计算这样,我们用概念叶来计算IC相似度的话,公式相应地表示为,
[0064]
[0065] 其中P(leaves(Ci^))是概念叶中任何一个实例出现的几率。
[0066] 于是,相似度SimIC(Ci′,Ci)的值计算公式为:
[0067]
[0068] 最后,标准化IC相似度的值,如公式(3)所示。
[0069]
[0070] 2)计算SimND(Ci′,Ci)的值
[0071] 定义1在本体层次结构中,若有两个概念节点Ci′,,Ci,记len(Ci′,,Ci)为Ci′,Ci之间的最短路径。
[0072] 定义2在本体层次结构中,若有一节点Ci,记其深度为depth(Ci)=len(root,Ci),其中root为结构中的根节点。
[0073] 那么,在本体层次结构中,对任意两个节点Ci′,,Ci,则定义其ND相似度为:
[0074]
[0075] 当利用公式(4)计算出所有的概念对的ND相似度后,利用公式(5)进行标准化。
[0076]
[0077] 3)计算SimIC-ND(Ci′,Ci)和SimIC-ND(C′,C)的值
[0078] 当SimIC(Ci′,Ci)和SimND(Ci′,Ci)的值求出并标准化后,通过公式(6)求出SimIC-ND(Ci′,Ci),通过公式(7)求出SimIC-ND(C′,C)的值。
[0079]
[0080]
[0081] 最后,验证相似度算法的效果以及检索方案的效果。
[0082] (4)研究数据挖掘模型评价技术
[0083] 首先,研究数据挖掘模型的评价指标,构建准确、完备的评价指标体系。
[0084] 数据挖掘模型指标仅仅是从不同度量化了挖掘模型的特征,而如何明确这些指标对于模型的影响程度,即怎样综合处理各项特征,获得能够体现模型优点与缺点的度量,需要模型的综合评价体系。根据数据挖掘模型性能评价的具体分析以及建立评估指标体系所遵循的原则和过程,本发明建立了挖掘模型性能评估指标的本体结构体系,如图7所示。
[0085] 本发明的本体编码采用OWL语言。OWL适用于这样的应用:在这些应用中,不仅仅需要提供给用户可读的文档内容,而且希望处理文档内容信息。OWL能够被用于清晰地表达词汇表中的词条(term)的含义以及这些词条之间的关系。而这种对词条和它们之间的关系的表达就称作本体。OWL相对XML、RDF和RDFSchema拥有更多的机制来表达语义,从而OWL超越了XML、RDF和RDFSchema仅仅能够表达网上机器可读的文档内容的能力。本体开发工具采用Stanford的protege2000。
[0086] 数据挖掘模型评价本体的每个概念类包括9个主要属性描述:ClassName,Weight,Haschild,Value Type,Effect Type,EvaluateMethod,EstimateFunction,NodeValue,Unit。
[0087] ClassName为该概念类的名称,以概念名称为唯一标志,各评价因子之间不允许有重名。
[0088] Weight是评价因子的权值,同时评价本体上节点的权重有以下约束条件:
[0089] 根节点的权重为1;
[0090] 任意一个评价因子节点的权重是它的所有子节点权重的总和;
[0091] Haschild标明是否有子节点,若有子节点则其本身没有独立的指标值,由其子指标共同表征。
[0092] Value Type代表取值类型(数值型、区间型、语言型、布尔型等)。
[0093] Effect Type代表因子的质量影响,其中效益型因子如可用性,标明指标值越大越好,而成本型因子如价格,指标值越小越好。
[0094] EvaluateMethod标明指标取值方法(固定型、统计型、计算型、设定型)。
[0095] EstimateFunction为计算性指标的估算函数。
[0096] NodeValue为评价因子的取值。
[0097] Unit为指标取值的单位。
[0098] 利用OWL语言实现本文的数据挖掘性能指标评价体系,部分代码显示如下:
[0099]
[0100]
[0101] 然后,确定指标权重的计算方法以及指标量化值的计算方法。
[0102] 求权重是综合评价的关键。数据挖掘技术是面向应用领域的,在同一应用领域,不同的评价因子对数据挖掘模型性能的影响程度也不相同;对于同一评价指标来说,应用的挖掘业务不同,可能关注的程度也会有所差异。这样,指标权重需要根据应用业务及评价因子本身的特点来获得,需要考虑客观及主观两个方面。因此,本发明采用主客观综合集成赋权法将本体结构计算权重法和AHP法结合起来。
[0103] 结合评价体系的应用特点,选用层次分析(Analytic Hierarchy Process,AHP)法作为补充。层次分析法(Analytic Hierarchy Process,AHP),是从定性分析到定量分析综合集成的一种典型的系统工程方法,它将复杂系统的思维过程数学化,将主观判断为主的定性分析进行定量化,将各种判断要素之间的差异数值化,从而,保持思维过程的一致性,适用于复杂的模糊综合评价应用。这样,附加上层次分析法,我们能把外在的专家对评价指标重要性的主观评价来作为对权重的一个重要调整因素,从而大大提高了结果的准确性。
[0104] 本发明提出的Os-Ahp(Ontology structure-Analytic hierarchy process)法,即加权本体结构法和层次分析法过程如下:首先利用本体结构法计算出各个数据挖掘评价指标的权重,再利用层次分析法(Analytic Hierarchy Process-AHP)计算出各个指标的权重,最后加权求出最终的指标权重。这样,从客观因素方面来讲,即从本体的内在结构来确定数据挖掘评价指标的权重;从主观因素方面来讲,即通过外在的专家对评价指标重要性的主观评价来确定其权重。
[0105] 详细过程如下:
[0106] 1)利用本体结构法确定指标权重
[0107] 设本体结构法确定的权重记作Wo,其分为两部分即Wo=Wm+Ws;Wm表示主要部分(Main part),Ws表示次要部分(Secondary part)。
[0108] Wm的计算方法:
[0109] 法则1:如果父概念A的权重为a,且有n个子概念,则每个子概念权重的主要部分Wm=a/m。定义本体根节点权重为1即W(root)=1
[0110] Ws的计算方法:Wm=βSim(.,.);
[0111] Sim(.,.)表示该概念与其父概念的相似度,其计算方法见本文第三章两概念相似度求法;β表示调整系数,目前主要是经验确定。
[0112] 2)利用AHP法求权重
[0113] 层次分析法确定权重的做法如下:①建立多层次的递阶结构。按目标的不同、实现功能的差异,将系统分为递阶层次结构体系。②构造判断矩阵。在建立多层次递阶结构体系后,通过各层中元素两两比较,构造比较判断矩阵,确定下一层对于上一层次某因素的相对重要性,并赋予一定分值。通常采用的标度准则为T·L·Saaty教授提出的标度表,如表1所示。
[0114] 指标判断矩阵的比较标度表及其含义
[0115] 表1指标判断矩阵的比较标度表及其含义
[0116]标度值 含义
1 因素ui和uj比较,同等重要
3 因素ui和uj比较,ui比uj较为重要
5 因素ui和uj比较,ui比uj更为重要
7 因素ui和uj比较,ui比uj强烈重要
9 因素ui和uj比较,ui比uj极端重要
2,4,6,8 分别表示相邻判断,分别取1~3,3~5,...,中间值
[0117] 倒数:因素ui与uj比较得判断uij,则ui与uj比较得判断uji=1/uij,根据标度表可构造判断矩阵T:
[0118]
[0119] ③计算指标权重。根据判别矩阵T,利用线性代数知识,可以精确地求出其最大特征根及对应的特征向量。将特征向量归一化处理即得到该层次评价因素对父因素影响程度的大小。最大向量的求解有多种方法例如和积法,方根近似法等,由于方根近似法更为常用,故本文采用方根近似法进行求解,步骤如下:
[0120] Step 1计算判断矩阵每一行元素的乘积Mi,
[0121] Mi=IIuij,(i,j=1,2,…m)
[0122] Step 2计算Mi的m次方根
[0123]
[0124] Step 3对向量W′=(W1,W2,...,Wm)归一化处理。
[0125]
[0126] WA=(w1,w2,...,wm)即为所求指标的权重
[0127] Step 4一致性检验
[0128] 求出权重后,需要对判别矩阵进行一致性检验,公式如下:
[0129] CR=CI/RI
[0130] CR为判断矩阵的随机一致性比率,CI为判断矩阵一致性指标,计算公式如下:
[0131] CI=(λmax-m)/(m-1)
[0132] RI的值可以根据Saaty标度结果和CI的值计算得出。
[0133] 式中,λmax为判断矩阵的最大特征根。
[0134] 二者加权求和即得到最终权重W
[0135] W=k1Wo+k2WA
[0136] (k1,k2为二者权重,且k1+k2=1)
[0137] 最后,建立综合利用这些指标定量度量数据挖掘模型性能的方法。
[0138] 具体步骤如下:
[0139] Step 1建立挖掘模型评估指标集
[0140] 建立合理的数据挖掘模型指标评估体系,是挖掘模型性能有效评估的基础,也是最关键的问题。没有科学的评估指标体系,评估工作就无法正确进行。DMME-OAF指标评价体系的设计遵循以下基本原则:
[0141] (1)全面性原则,在模型性能评价研究中,全面考虑模型的各类指标,综合精确度、效益、运行效率等各个方面,尽可能全面地评价挖掘模型工作性能。
[0142] (2)平衡性原则,在挖掘模型性能评价因素的考察中,需要考察能够反映模型能力的正确性因素,也需要考虑模型的资源消耗因素。即需要关注挖掘模型的业务能力,也不能忽略模型各个方面的代价。
[0143] (3)实用性原则,挖掘模型的设计最终的目标是为应用服务,而不仅仅正确性上比较哪个模型的建模方法深奥或者复杂,挖掘模型的评价同样需要考察能够为挖掘业务带来的效益,因此,评价体系需要综合价值方面的因素。
[0144] 本发明在建立挖掘模型性能指标评估体系结构的基础上实现了DMME-OAF的数据挖掘评价模型设计。应用时有两点说明:
[0145] (1)层次的指标可以扩展,当需要考虑更多方面的因素,根据实际需要可以扩展评估指标。
[0146] (2)最终用来作为决策的指标集是该指标体系的一个子集,可以根据实际况选择不同的指标集。例如:
[0147] 可以将U={提升度 效益 覆盖度 契合度 命中率 运行时间 复杂度}作为决策指标集,也可以将指标“契合度”换成它的子集{简洁性 确定性 实用性 感兴趣度 新颖性 可解释性 可视化},即U′={提升度 效益 覆盖度简洁性 确定性 实用性 感兴趣度 新颖性 可解释性 可视化 命中率 运行时间 复杂度}。
[0148] 当测试情况允许时,可以将指标分得更细化,这样结果更准确,当测试条件不充分的话,可以用较笼统的指标粗略评价。本文采用U′作为评价指标集。
[0149] Step 2设计挖掘模型性能评语集
[0150] 在所有的评价指标中,不是所有的指标都可以定量计算,部分指标是定性描述,即通过专家评价获得评语,作为模糊语言值。评语集是对评价对象可能做出的评价结果所组成的集合,表示为V={v1,v2,v3,…,vn}。考虑评价等级的合理密度,在挖掘模型评价体系中采用五级评语集,即
[0151] V={很好,较好,中,较差,很差}。
[0152] Step 3求解挖掘模型各个评价因素的评语
[0153] 对于挖掘模型的各个评价因素,系统给出具体量化。当所有的定性指标给出定性评价后,需要将定性评价量化,并建立隶属度函数。定性评价量化赋值按表2进行。
[0154] 表2定性评价量化赋值
[0155]
[0156] 相应的隶属度函数式如下:
[0157]
[0158] 其中a表示矩阵元素xij的上限阂值;b矩阵元素xij的下限阂值。
[0159] 通过评语的量化和隶属度函数,能得出评价指标矩阵(隶属度矩阵)R:
[0160]
[0161] 令
[0162]
[0163] 将各因素进行归一化处理,得到R0为:
[0164]
[0165] Step 4利用上面的求权重的方法求出权重集W
[0166] Step 5计算评判结果矩阵B
[0167] 将权重矩阵W与归一化处理后的评判矩阵R0相乘,即可得评判结果矩阵BB=W·R0。根据最大隶属度原则,选出最优方案。
[0168] 整个基于本体和CBR建模的数据挖掘模型评价过程伪代码如图8所示。
[0169] (5)局部过程的智能化集成
[0170] 此过程包含两个方面:一是基于智能数据挖掘技术和关联知识模型的初始设计过程集成,二是基于智能数据挖掘技术和关联知识模型的仿真反馈设计过程集成,有利于系统最终的集成和完善。
[0171] (6)系统的总体集成、测试、完善
[0172] 本发明系统的总体架构如图9所示,可以看出,系统分四层:用户界面层、功能模块层、技术平台层、数据层。
[0173] 用户界面层:用户界面层也叫事务层,是用户和计算机进行交流的窗口,包括信息输入和信息输出。信息输入的方式主要有以下三种:产品CAD三维视图直接加载;人工交互(界面向导提示);基于UDF特征信息识别与提取。
[0174] 技术平台层:这一层主要说明了实现本系统的结构和功能所用的各种主要技术及平台例如本体实现所用的OWL语言,存储数据所用的数据库Access,存储数据所用的接口技术ADO.Net等。
[0175] 数据层:以数据和文档形式保存各种信息,包含有五个数据库:零件信息库、制造资源库、工艺规划知识库、数据挖掘事例库。
[0176] 功能模块层:本发明系统中定义了6个基本功能模块,分别是:知识检索模块、数据挖掘事例检索模块、数据挖掘事例修改模块、数据挖掘与知识发现模块、工艺知识学习模块和数据挖掘事例学习模块(即知识存储模块)。
[0177] (1)知识检索模块
[0178] 知识检索模块即工艺规划知识查询模块,其界面如图10所示。当利用系统进行工艺规划时,首先根据设计任务进行工艺知识的查询,如果能直接获得相应的知识,则系统运行至此为止,如果不能查询到满意的知识,则进入数据挖掘模块,通过数据挖掘获取想要的知识。
[0179] (2)数据挖掘事例检索模块
[0180] 当在知识检索模块中不能直接获得满意的知识时,就不得不通过数据挖掘技术来获取所需的知识,这时可以由界面向导导入数据挖掘事例检索模块,如图11所示。
[0181] 在这个模块,根据界面向导提示输入相关信息,进行相似事例的检索。数据挖掘事例的检索和知识检索是不相同的。知识的检索是具体实例信息的匹配,精确度要求较高(阂值α≥0.9500);数据挖掘事例的检索是概念层次上的抽象匹配,精确度要求比知识检索的要低(阂值α<0.9500)。通过数据挖掘事例检索返回通常是一组事例,这就要求通过数据挖掘评价机制进行评价以获得最佳事例。如果由检索评价获得的事例达不到最低阂值(阂值α=0.9000),这时,不得不进入事例修改模块,通过事例修改,以获得满意的数据挖掘事例。
[0182] (3)数据挖掘事例修改模块
[0183] 数据挖掘事例修改模块如图12所示。目前,在数据挖掘事例修改模块,主要通过修改相关概念的权重,以及加减概念特征来调节的。每次修改完毕,都要通过模块的事例评估功能来进行评估,如果达不到阂值(α=0.9000)以上,则根据评估提示继续调整,直到检索相似度的值达到0.9000以上为止,然后进入下一个模块即数据挖掘与知识发现模块。
[0184] (4)数据挖掘与知识发现模块
[0185] 当已经获得一个满意的数据挖掘事例时,也即意味着建立了一个满意的数据挖掘模型,可以进行数据挖掘和知识发现了。数据挖掘与知识发现模块如图13所示,直接点击“执行数据挖掘”按钮,即可以获得满足设计任务所需要的知识。为了更精确起见,在这个模块设置了知识评价功能,可以对获取的知识进行评价,然后再应用。如果评价结果是“Yes”还可以从这个界面进入知识学习模块和事例学习模块。如果评价结果是“No”,则要重新返回数据挖掘事例检索模块,一个新的循环过程重新开始,直到评价结果是“Yes”为止。
[0186] (5)工艺知识学习模块
[0187] 在数据挖掘与知识发现模块中,当最后挖掘出的工艺知识经评价是满意即显示“Yes”字样时,说明了数据挖掘出的工艺知识是准确的,那么这个知识就可以存入知识库,以供下次检索使用。于是,由工艺知识学习界面如图14所示,将知识存入知识库。
[0188] (6)数据挖掘事例学习模块
[0189] 在数据挖掘与知识发现模块中,当知识评价为“Yes”时,不但证明了挖掘所获的知识是准确的,同时也证明了数据挖掘建模是恰当的,因此,这个成功的事例应该被存入数据挖掘事例库,完成事例的学习。于是,由数据挖掘事例学习界面如图15所示,将事例存入事例库。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈