首页 / 专利库 / 信号处理 / 信号处理 / 音频信号处理 / 音频分割 / 一种适用于高端装备的复杂知识自动分类、获取及存储方法

一种适用于高端装备的复杂知识自动分类、获取及存储方法

阅读:477发布:2020-05-14

专利汇可以提供一种适用于高端装备的复杂知识自动分类、获取及存储方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种适用于高端装备的复杂知识自动分类、获取及存储方法,包括:从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度对知识资源进行归纳 整理 ,并采用朴素贝叶斯分类器对其进行自动分类的复杂知识自动分类方法;根据基于元知识模型的复杂知识获取模板,通过基于获取模板的半自动化获取技术对复杂知识资源进行获取的复杂知识获取方法;以及通过一系列的自动切分规则将复杂知识资源从物理上进行分割,并将关键信息压缩后分布式保存到不同存储空间的复杂知识自动存储方法。本发明涵盖了复杂知识自动分类、获取和存储的方法,为高端装备制造企业复杂知识资源的运用提供 基础 和 支撑 。,下面是一种适用于高端装备的复杂知识自动分类、获取及存储方法专利的具体信息内容。

1.一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,包括以下步骤:
步骤1:根据高端装备制造企业复杂知识资源的特征,从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度对其进行梳理,并用朴素贝叶斯分类器对其进行自动分类;所述步骤1的采用朴素贝叶斯分类器进行分类,包括如下步骤:
步骤1.1:将高端装备制造企业复杂知识资源映射到向量空间中,映射方式如下:
其中,x是5000维的特征向量,且xi只能为0或1,其含义是:xi=0表示xi对应于高端装备词典中的内容在该条知识资源中未出现,xi=1表示xi对应于高端装备词典的内容在该条知识资源中出现;其中,高端装备词典是通过计算机选取高端装备领域1000条样本知识资源中出现过5次以上的词汇组成,共计5000个词汇;
步骤1.2:通过m条样本知识资源的学习得到条件概率 和先验概率 学习方式如下:
其中,1≤i≤5000,1≤j≤l,Ci表示高端装备复杂知识资源的类别, 表示xi对应的词汇在样本知识资源k中出现,C(k)=Cj表示样本知识资源k属于类别Cj,由于从三个维度对高端装备进行分类,且每个维度类别数量不一,这里统一假设复杂知识某一维度分为l个类别,表示为:C={C1,C2,…,Cl};
符号“1{}”定义为当“{}”内的条件为真时,其值为1,否则为0;
为了使参数 和 的值不为0,引入了拉普拉斯平滑对其进行处理,得到最终的参数学习公式:
步骤1.3:将步骤1.1的特征向量输入到已经训练好的朴素贝叶斯分类器中:
其中,C(x)表示特征向量x属于的类别,1≤j≤l;
步骤1.4:根据朴素贝叶斯分类器的计算结果,自动选取使得概率最高的类别为该条知识资源所属的类别;
步骤2:在上述步骤1对高端装备制造企业复杂知识资源自动分类的基础之上,按照其表现形式选取相应的基于元知识模型的复杂知识获取模板,通过标准化的知识资源获取界面,结合人工获取技术和半自动化获取技术,对复杂知识资源进行获取;
步骤3:针对上述步骤1和步骤2对高端装备制造企业知识资源的自动分类和获取结果,通过一系列的自动切分规则将这些复杂知识资源从物理上进行分割,然后分布式保存到不同的存储空间,并将关键信息压缩成ZIP压缩管理文件,使其以自身40%~90%的大小存储在知识库中,以实现海量知识资源的高效存储。
2.根据权利要求1所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,所述步骤1的知识三维度分类的定义如下:
KTD={LifCycDim,ExpForDim,SubDim}
LifCycDim={ProDes,ProManu,ProAsse,UseMain}
ExpForDim={DoctKn,DataKn,ProsKn,ExptKn}
SubDim={ProObjt,ProDesn,ManuEngr,UseMaint}
KTD表示高端装备复杂知识三个维度分类的集合,元素LifCycDim是知识生命周期维度的集合,元素ExpForDim是知识表现形式维度的集合,SubDim是知识主题维度的集合;
在知识生命周期维度中,元素ProDes为产品设计类知识资源,元素ProManu为产品制造类知识资源,元素ProAsse为产品装配类知识资源,元素UseMain为使用维护类知识资源;
在知识表现形式维度中,元素DoctKn文档类知识资源,元素DataKn为数据类知识资源,元素ProsKn为过程类知识资源,元素ExptKn为专家经验类知识资源;
在知识主题维度中,元素ProObjt为产品对象类知识资源,元素ProDesn为产品设计类知识资源,元素ManuEngr为制造工程类知识资源,元素UseMaint为使用维护类知识资源。
3.根据权利要求1所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,所述步骤2的基于元知识模型的复杂知识获取模板由<属性>和<属性值>组成,包括:基于元知识模型的文档类/数据类/经验类知识获取模板和基于元知识模型的过程类知识获取模板。
4.根据权利要求1所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,所述步骤2的半自动化获取技术采用产生式规则对部分模板的<属性值>进行自动获取,且该产生式规则的表现形式为:
<产生式规则>=如果<前件>,那么<后件>。
5.根据权利要求1所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,所述步骤3的对复杂知识资源从物理上进行自动分割和分布式存储的步骤如下:
步骤3.1:将由基于获取模板获取的构成元知识的<属性>和<属性值>的集合存储于元知识表中;
步骤3.2:将元知识内容按文字、音频、视频、模型、图片、公式和表格分解成m个文件分片,记为:F={F1,F2,…Fm},且 1≤i<j≤m;
步骤3.3:将文件分片Fi压缩成ZIP压缩管理文件;
步骤3.4:将压缩后的文件分片Fi哈希化,并对Fi的哈希值进行取模运算,并采用一致性哈希策略将元知识内容分布式存储到N个不同的数据库中。
6.根据权利要求5所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,步骤3.4的对Fi的哈希值进行取模运算的定义如下式:
targetServer=hash(Fi)%N             (7)
targetServer表示分配给每个数据库的文件分片的大小,N表示总共有N个数据库。

说明书全文

一种适用于高端装备的复杂知识自动分类、获取及存储方法

技术领域:

[0001] 本发明属于先进制造技术智能化信息技术领域,特别涉及一种适用于高端装备的复杂知识自动分类、获取及存储方法。背景技术:
[0002] 以高档数控机床、大型燃气轮机汽轮机、超/特高压电气装备、智能电装备等为代表的高端装备制造业是典型的知识密集、技术密集和多学科交叉集成的高科技产业,随着技术的进步,当前高端装备制造企业正从以产品为中心转向以知识为中心的新产品开发中,以知识为中心的新产品开发正成为企业提高其竞争力的核心因素,产品结构日趋复杂,开发过程日趋复杂,产品功能日趋集成化和复合化,导致产品开发直至全生命周期均需各种复杂知识的支持,产品的设计、制造、维护等活动均需要各种知识资源的融合,各种复杂知识的高效运用已成为支撑高端装备产品技术创新的原动力。而复杂知识自动分类、获取及存储方法作为复杂知识运用的核心和关键,制约的因素主要有:
[0003] (1)知识分类方面:典型的知识分类方法主要包括波拉尼(Michael Polanyi)知识分类法和联合国经合组织(OECD)的分类法,这两种分类方式有助于对人类总体知识的分析与认知,但并不适用于以支持企业创新为目的的知识资源管理系统的开发;在服务于知识管理系统开发方面的知识分类多数只囊括了产品研发某一领域的知识,或者只从单一维度出发对产品研发各阶段知识进行分类,无法满足高端装备制造企业数量庞大、内容复杂、形式多样、格式异构的知识资源的分类需求。
[0004] (2)在知识获取方面:知识获取方面的研究主要聚焦在自动获取技术上,但其涉及到人工智能的多个尚不成熟的研究领域,因此还只是知识获取技术的一个长期奋斗目标;而当前企业主要采用的人工获取方式,虽然获取知识准确度高但效率低,无法胜任高端装备制造企业复杂知识的获取需求。
[0005] (3)在知识存储方面:当前,数据库技术虽已日趋成熟,但尚无支持高端装备制造企业数量庞大、内容复杂、形式多样、格式异构的知识资源的存储模型,更缺乏与高端装备制造企业复杂知识资源分类与获取方法相适应的存储方法。发明内容:
[0006] 本发明的目的在于针对现有方法的缺陷,提供一种适用于高端装备的复杂知识自动分类、获取及存储方法,为高端装备制造企业复杂知识资源的运用提供基础和支撑。
[0007] 为达到上述目的,本发明采取如下的技术方案来实现:
[0008] 一种适用于高端装备的复杂知识自动分类、获取及存储方法,包括以下步骤:
[0009] 步骤1:根据高端装备制造企业复杂知识资源的特征,从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度对其进行梳理,并用朴素贝叶斯分类器对其进行自动分类;
[0010] 步骤2:在上述步骤1对高端装备制造企业复杂知识资源自动分类的基础之上,按照其表现形式选取相应的基于元知识模型的复杂知识获取模板,通过标准化的知识资源获取界面,结合人工获取技术和半自动化获取技术,对复杂知识资源进行获取;
[0011] 步骤3:针对上述步骤1和步骤2对高端装备制造企业知识资源的自动分类和获取结果,通过一系列的自动切分规则将这些复杂知识资源从物理上进行分割,然后分布式保存到不同的存储空间,并将关键信息压缩成ZIP压缩管理文件,使其以自身40%~90%的大小存储在知识库中,以实现海量知识资源的高效存储。
[0012] 本发明进一步的改进在于,所述步骤1的知识三维度分类的定义如下:
[0013] KTD={LifCycDim,ExpForDim,SubDim}
[0014] LifCycDim={ProDes,ProManu,ProAsse,UseMain}
[0015] ExpForDim={DoctKn,DataKn,ProsKn,ExptKn}
[0016] SubDim={ProObjt,ProDesn,ManuEngr,UseMaint}
[0017] KTD表示高端装备复杂知识三个维度分类的集合,元素LifCycDim是知识生命周期维度的集合,元素ExpForDim是知识表现形式维度的集合,SubDim是知识主题维度的集合;
[0018] 在知识生命周期维度中,元素ProDes为产品设计类知识资源,元素ProManu为产品制造类知识资源,元素ProAsse为产品装配类知识资源,元素UseMain为使用维护类知识资源;
[0019] 在知识表现形式维度中,元素DoctKn文档类知识资源,元素DataKn为数据类知识资源,元素ProsKn为过程类知识资源,元素ExptKn为专家经验类知识资源;
[0020] 在知识主题维度中,元素ProObjt为产品对象类知识资源,元素ProDesn为产品设计类知识资源,元素ManuEngr为制造工程类知识资源,元素UseMaint为使用维护类知识资源。
[0021] 本发明进一步的改进在于,所述步骤1的采用朴素贝叶斯分类器进行分类,包括如下步骤:
[0022] 步骤1.1:将高端装备制造企业复杂知识资源映射到向量空间中,映射方式如下:
[0023]
[0024] 其中,x是5000维的特征向量,且xi只能为0或1,其含义是:xi=0表示xi对应于高端装备词典中的内容在该条知识资源中未出现,xi=1表示xi对应于高端装备词典的内容在该条知识资源中出现;其中,高端装备词典是通过计算机选取高端装备领域1000条样本知识资源中出现过5次以上的词汇组成,共计5000个词汇;
[0025] 步骤1.2:通过m条样本知识资源的学习得到条件概率 和先验概率 学习方式如下:
[0026]
[0027]
[0028] 其中,1≤i≤5000,1≤j≤l,Cj表示高端装备复杂知识资源的类别, 表示xi对应的词汇在样本知识资源k中出现,C(k)=Cj表示样本知识资源k属于类别Cj,由于从三个维度对高端装备进行分类,且每个维度类别数量不一,这里统一假设复杂知识某一维度分为l 个类别,表示为:C={C1,C2,…,Cl};
[0029] 符号“1{}”定义为当“{}”内的条件为真时,其值为1,否则为0;
[0030] 为了使参数 和 的值不为0,引入了拉普拉斯平滑对其进行处理,得到最终的参数学习公式:
[0031]
[0032]
[0033] 步骤1.3:将步骤1.1的特征向量输入到已经训练好的朴素贝叶斯分类器中:
[0034]
[0035] 其中,C(x)表示特征向量x属于的类别,1≤j≤l;
[0036] 步骤1.4:根据朴素贝叶斯分类器的计算结果,自动选取使得概率最高的类别为该条知识资源所属的类别。
[0037] 本发明进一步的改进在于,所述步骤2的基于元知识模型的复杂知识获取模板由<属性> 和<属性值>组成,包括:基于元知识模型的文档类/数据类/经验类知识获取模板和基于元知识模型的过程类知识获取模板。
[0038] 本发明进一步的改进在于,所述步骤2的半自动化获取技术采用产生式规则对部分模板的<属性值>进行自动获取,且该产生式规则的表现形式为:
[0039] <产生式规则>=如果<前件>,那么<后件>。
[0040] 本发明进一步的改进在于,所述步骤3的对复杂知识资源从物理上进行自动分割和分布式存储的步骤如下:
[0041] 步骤3.1:将由基于获取模板获取的构成元知识的<属性>和<属性值>的集合存储于元知识表中;
[0042] 步骤3.2:将元知识内容按文字、音频、视频、模型、图片、公式和表格分解成m个文件分片,记为:F={F1,F2,…Fm},且
[0043] 步骤3.3:将文件分片Fi压缩成ZIP压缩管理文件;
[0044] 步骤3.4:将压缩后的文件分片Fi哈希化,并对Fi的哈希值进行取模运算,并采用一致性哈希策略将元知识内容分布式存储到N个不同的数据库中。
[0045] 本发明进一步的改进在于,步骤3.4的对Fi的哈希值进行取模运算的定义如下式:
[0046] targetServer=hash(Fi)%N                              (7)[0047] targetServer表示分配给每个数据库的文件分片的大小,N表示总共有N个数据库。
[0048] 与现有的技术方法相比,本发明的优点在于:
[0049] (1)本发明从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度对高端装备制造企业的知识资源进行分类与归纳整理,并采用训练好的朴素贝叶斯分类器对其进行自动分类,克服了以往只囊括研发过程中某一领域或者单一维度的知识分类方式的缺陷,满足了高端装备制造企业数量庞大、内容复杂、形式多样、格式异构的知识资源的自动分类需求,实现了对高端装备制造企业复杂知识资源全面、准确的分类。
[0050] (2)根据本发明设计的基于元知识模型的复杂知识获取模板,通过标准化的知识资源获取界面,结合人工获取技术和半自动化获取技术,实现了对高端装备制造企业复杂知识资源高效、准确地获取。且基于获取模板的复杂知识半自动化获取方式便于高端装备制造企业实际应用,克服了手动获取方式效率低下、自动获取方式尚不成熟的缺陷。
[0051] (3)本发明将复杂知识资源从物理上进行分割,然后分布式保存到不同的存储空间,并将关键信息压缩使其以极小的字节存储在知识库中,实现了对高端装备制造企业数量庞大、内容复杂、形式多样、格式异构的知识资源的高效存储。附图说明:
[0052] 图1高端装备制造企业复杂知识资源分类、获取以及存储过程图
[0053] 图2高端装备制造企业复杂知识资源的分类结构图;
[0054] 图3元知识建模过程模型;
[0055] 图4高端装备制造企业复杂知识资源获取模板,其中图3(a)为文档类/数据类/经验类知识资源的获取模板,图3(b)为过程类知识资源的获取模板;
[0056] 图5高端装备制造企业复杂知识资源的存储模板。具体实施方式:
[0057] 以下结合附图对本发明做出进一步的详细说明。
[0058] 为支持高端装备制造业创新发展,实现高端装备制造企业创新资源高效集成,本发明围绕高端装备产品的全生命周期,从方法和技术层面上,突破了如图1的复杂知识资源自动分类、获取以及存储的方法与技术,实现了对复杂知识资的多维度分类和高效获取与存储。
[0059] 1.高端装备制造企业复杂知识自动分类方法
[0060] 1.1高端装备制造企业复杂知识资源特征分析与分类
[0061] 本发明基于高端装备制造企业知识资源的复杂性、分布性、异构性和变化性的特点,从便于高端装备制造企业知识资源有效管理与应用的度,提出了如图2的从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度实现对高端装备制造知识资源进行分类与归纳整理的方法,其中,知识三维度分类的定义如下式:
[0062] KTD={LifCycDim,ExpForDim,SubDim}
[0063] LifCycDim={ProDes,ProManu,ProAsse,UseMain}
[0064] ExpForDim={DoctKn,DataKn,ProsKn,ExptKn}
[0065] SubDim={ProObjt,ProDesn,ManuEngr,UseMaint}
[0066] KTD表示高端装备复杂知识三个维度分类的集合,元素LifCycDim是知识生命周期维度的集合,元素ExpForDim是知识表现形式维度的集合,SubDim是知识主题维度的集合;
[0067] 在知识生命周期维度中,元素ProDes为产品设计类知识资源,元素ProManu为产品制造类知识资源,元素ProAsse为产品装配类知识资源,元素UseMain为使用维护类知识资源;
[0068] 在知识表现形式维度中,元素DoctKn为文档类知识资源,元素DataKn为数据类知识资源,元素ProsKn为过程类知识资源,元素ExptKn为专家经验类知识资源;
[0069] 在知识主题维度中,元素ProObjt为产品对象类知识资源,元素ProDesn为产品设计类知识资源,元素ManuEngr为制造工程类知识资源,元素UseMaint为使用维护类知识资源。
[0070] 根据上述定义,本发明建立了表1~3的知识分维度分类表。
[0071] 1.1.1基于知识生命周期维度的知识资源分类
[0072] 从产品生命周期维度将知识资源划分为产品设计知识、产品制造知识、产品装配知识、产品维护知识等类型,方便对复杂知识资源的获取管理。表1为建立的基于生命周期维度的复杂知识资源分类表。
[0073] 表1基于生命周期维度的复杂知识资源分类表
[0074]
[0075]
[0076] 产品设计知识:产品设计知识主要涵盖产品本身知识,产品设计过程知识,和支持产品设计的相关知识,具体表现会覆盖概念方案设计、基本设计和详细设计,即高端装备完整设计过程。
[0077] 产品制造知识:产品制造知识可分为设计知识、工艺知识、检验知识和材料知识等,覆盖零部件的加工、标准零部件的选购等方面。
[0078] 产品装配知识:产品装配知识涉及产品装配基础理论、装配规程设计、装配方案设计、装配路线设计、装配流程、工装设计、装配标准规范等诸多方面;覆盖各模系统内的装配、不同模块系统间的组装等各个装配阶段。
[0079] 使用维护知识:使用维护知识主要包含产品的安装调试,产品的操作使用说明及相关注意事项,产品的定期维护保养,及产品出现典型故障时的修理规程及方法。
[0080] 1.1.2基于知识表现形式维度的知识资源分类
[0081] 从知识资源的表现形式维度将高端装备制造企业的知识资源划分为数据类知识、文档类知识、过程类知识和经验类知识四种类型,方便复杂知识资源的存储管理。表2为建立的基于表现形式维度的复杂知识资源分类表。
[0082] 表2基于表现形式维度的复杂知识资源分类表
[0083]
[0084] 数据类知识:主要包括市场调研数据、商贸数据、高端装备性能参数、精度与可靠性参数、运动功能参数、控制功能参数、电气功能参数、模块内及模块间的装配与配合结构参数、加工/检测设备数据、试验数据、检测数据等。
[0085] 文档类知识:表现为纯文档、图形文档、图像文档或混合文档的形式,主要包括企业已有高端装备产品的二维图纸与三维模型、设计过程文件、制造与装配工艺文件、通用零部件模型库、标准零部件模型库、维修维护手册、工具书等。
[0086] 过程类知识:主要表现为程序或软件的形式,包括决策知识软件,各类 CAD/CAE/CAPP/CAM软件,静力学分析、模态分析、动力学分析、温度-结构应力耦合分析等计算分析软件,刀具智能选配、刀具加工过程膜破损监测等过程软件等。
[0087] 经验类知识:主要指企业研发人员、科研院所研究人员等在高端装备的设计、制造、装配、维修等方面的经验及他们所发表的有关高端装备研发的文章专著,高端装备制造企业所拥有的高端装备各模块研发及整机研发实例等。
[0088] 1.1.3基于知识主题维度的知识资源分类
[0089] 从知识资源所属主题领域维度将高端装备企业的知识资源划分为产品对象类知识、产品设计类知识、制造工程类知识和使用维护类,方便对知识资源的语义表达与应用服务。表3 为建立的基于主题维度的复杂知识资源分类表。
[0090] 表3基于主题维度的复杂知识资源分类表
[0091]
[0092] 产品对象类知识:要指针对不同类高端装备产品的划分以及同类高端装备产品的细分、高端装备的模块划分、高端装备产品总体参数等。本文中的高端装备产品可分为高档数控机床、大型燃气轮机、汽轮机、超/特高压电气装备、智能电力装备等类别;高档数控机床又细分为加工中心、镗铣床、成型加工机床等不同类型机床;特定高档数控机床又分为机床支承件模块、主运动系统模块、工作台模块、进给运动系统模块、冷却系统模块、润滑系统模块、刀库系统模块、防护系统模块等不同模块系统。
[0093] 产品设计类知识:用于描述高端装备产品的结构拓扑方案设计、结构基本设计、结构详细设计与结构设计有关的仿真分析与试验等知识资源。以高档数控机床的结构设计为例,在拓扑方案设计阶段,需根据机床总体性能参数对其物理域拓扑方案进行设计,如设计为箱中箱式、龙式、双床身式、双立柱式等;在基本设计阶段,需对结构的外形及内部加强筋的布局进行设计,如矩形床身、T型床身、矩形立柱、龙门立柱、圆形或方形工作台,井字型、米字型、或其他新型的加强筋布局等;在详细设计阶段,需对结构的具体尺寸进行设计;各个设计阶段涉及到的设计技术有仿真分析与试验等。
[0094] 制造工程类知识:描述高端装备产品的结构加工制造与装配流程设计等,包含零部件的加工、模块内的装配和模块间的组装。
[0095] 使用维护类知识:主要包括高端装备保养、使用工作条件、设备工作状态、性能要求、故障诊断、备配件、工具资源、检测方法、维修方法等知识资源。
[0096] 1.2基于朴素贝叶斯分类器的复杂知识自动分类方法
[0097] 本发明从三个维度对高端装备制造企业复杂知识资源进行分类,需要说明的是,这三个维度彼此独立,且唯一标识了高端装备领域的某条知识。为解决海量知识资源的分类问题,本发明采用一种生成学习算法——朴素贝叶斯分类器对其进行自动分类。朴素贝叶斯分类方法是一种最常用的监督式文本分类方法,以贝叶斯定理为理论基础,是一种在已知先验概率与条件概率的情况下的模式识别方法。利用朴素贝叶斯分类方法对高端装备制造企业复杂知识进行自动分类包括如下三个步骤:
[0098] 步骤1:将高端装备制造企业复杂知识资源映射到向量空间中,映射方式如下:
[0099]
[0100] 其中x是5000维的特征向量,且xi只能为0或1,其含义是:xi=0表示xi对应于高端装备词典中的内容在该条知识资源中未出现,xi=1表示xi对应于高端装备词典的内容在该条知识资源中出现。其中,高端装备词典是由计算机自动选取高端装备领域1000条样本知识资源中出现过5次以上的词汇组成高端装备词典,共计5000个词汇。
[0101] 步骤2:通过m条样本知识资源的学习得到条件概率 和先验概率 学习方式如下:
[0102]
[0103]
[0104] 其中,1≤i≤5000,1≤j≤l,Cj表示高端装备复杂知识资源的类别, 表示xi对应的词汇在样本知识资源k中出现,C(k)=Cj表示样本知识资源k属于类别Cj,由于本文从三个维度对高端装备进行分类,且每个维度类别数量不一,这里统一假设复杂知识某一维度分为l个类别,表示为:C={C1,C2,…,Cl};
[0105] 符号“1{}”定义为当“{}”内的条件为真时,其值为1,否则为0;
[0106] 为了使参数 和 的值不为0,引入了拉普拉斯平滑对其进行处理,得到最终的参数学习公式:
[0107]
[0108]
[0109] 步骤3:将步骤1.1的特征向量输入到已经训练好的朴素贝叶斯分类器中:
[0110]
[0111] 其中,C(x)表示特征向量x属于的类别;1≤j≤l
[0112] 步骤4:根据朴素贝叶斯分类器的计算结果,自动选取使得概率最高的类别为该条知识所属的类别。
[0113] 2基于知识获取模板的复杂知识资源半自动化获取方法
[0114] 高端装备制造企业知识资源具有内容复杂、格式异构等特性,为实现对高端装备制造企业知识资源的高效获取,本发明提出了基于知识获取模板的复杂知识资源半自动化获取方法,涉及基于元知识模型的复杂知识资源获取模板的设计方法以及基于获取模板的复杂知识资源半自动化获取技术。
[0115] 2.1基于元知识模型的高端装备制造企业复杂知识资源获取模板的设计[0116] 本发明提出了基于元知识模型的高端装备制造企业复杂知识资源获取模板的设计方法,该方法涉及元知识建模技术和基于元知识模型的高端装备制造企业复杂知识资源获取模板的设计。
[0117] 2.1.1元知识建模技术
[0118] 定义2-1元知识及元知识建模:元知识能够独立表达某一概念、原理或事物,它是能够使受用者独立使用,并能解决相关领域问题的最小知识单元。元知识建模是对元知识的正面描述,将元知识抽象化,形成最小的知识描述单元。
[0119] 元知识建模实际是为高端装备制造企业复杂异构的知识资源提供统一的知识描述形式,因而,为满足高端装备制造企业的实际需求,元知识建模需保证:1)知识描述的兼容性; 2)知识描述的一致性;3)知识描述的唯一性;4)知识描述的全面性;5)知识描述的可扩展性。为此,本发明在对高端数控备、动力装备、电力装备三类高端装备制造企业知识资源进行梳理之后,提出了如图3的统一的元知识建模过程模型。
[0120] 鉴于企业知识资源绝大部分由文档类知识和过程类知识构成,且数据类知识和经验类知识与文档类知识在知识内容的获取上具有极高的相似性,为此本发明拟建立两类知识内容获取方式,即过程类知识内容获取方式和文档类、数据类、经验类知识共用的知识内容获取方式,以降低高端装备制造企业对复杂异构知识资源的获取难度,保证知识描述的统一性。
[0121] 2.1.2基于元知识模型的复杂知识资源获取内容设计
[0122] 元知识建模的最终目的是为高端装备制造企业复杂异构的知识资源提供统一的知识内容获取方式,为此,本发明根据近几个月在企业的深入调研和知识搜集整理的实际情况,针对文档类、数据类、经验类和过程类四大类知识,基于元知识模型,对获取内容设计如下:
[0123] 1)基于元知识模型的文档类/数据类/经验类知识的获取
[0124] 在分析文档类、数据类、经验类知识资源的表征上极具相似性的基础上,为实现上述三类知识资源的全面、准确的获取,规划设计出基于元知识模型的文档类/数据类/经验类知识资源的获取内容如表4所示。
[0125] 表4基于元知识模型的文档类/数据类/经验类知识资源的获取内容
[0126]
[0127] 2)基于元知识模型的过程类知识资源的获取
[0128] 针对过程类知识资源的特征和表现形式,本发明规划设计出基于元知识模型的过程类知识资源的获取内容如表5所示。
[0129] 表5基于元知识模型的过程类知识资源的获取内容
[0130]
[0131]
[0132] 2.1.3基于元知识模型的复杂知识资源获取模板的设计
[0133] 根据规划设计出的基于元知识模型的复杂知识资源的获取内容(表4、表5),分别设计出知识资源的获取模板(如图4(a)、4(b)所示)。
[0134] 2.2基于知识获取模板的复杂知识资源半自动化获取技术
[0135] 本发明根据知识获取模板的<属性>和<属性值>,采用产生式规则对获取模板的部分属性值进行自动获取,获取规则如下:
[0136] <产生式规则>=如果<前件>,那么<后件>。
[0137] 例如:如果<复杂知识资源是二维设计图纸>,那么<获取模板的生命周期属性的“属性值”应为“详细设计”>。
[0138] 针对复杂知识获取模板中不能自动获取的<属性值>,本发明采用人工获取的方式对其< 属性值>进行获取。如“知识内容主体”这一属性的<属性值>较难自动获取,本发明采用标准化的获取界面,结合人工获取方式对其<属性值>进行获取。
[0139] 3.面向高端装备制造企业知识资源的自动存储方法
[0140] 针对高端装备制造企业的知识资源种类繁多、结构各异的特点,对已获取知识资源的有效存储是知识资源管理的另一关键问题。本发明综合采用数据库管理技术和文件管理技术,来实现对复杂知识资源的分类存储和管理。其中,分如下五个步骤对高端装备制造企业复杂知识资源进行存储:
[0141] 步骤1:将由基于获取模板获取的构成元知识的<属性>和<属性值>的集合存储于元知识表中;
[0142] 步骤2:将元知识内容分解成文字、音频、视频、模型、图片、公式、表格等m个文件分片,记为:F={F1,F2,…Fm},且
[0143] 步骤3:将文件分片Fi压缩成ZIP压缩管理文件;
[0144] 步骤4:将压缩后的文件分片Fi哈希化,并对Fi的哈希值进行取模运算(如式(7)所示),并采用一致性哈希策略将元知识内容分布式存储到N个不同的数据库中。
[0145] targetServer=hash(Fi)%N                                  (7)[0146] targetServer表示分配给每个数据库的文件分片的大小,N表示总共有N个数据库。据此,形成图5的高端装备制造企业复杂知识资源存储模板。
[0147] 基于上述存储模板,采用MySQL大型数据库实现对不同知识资源的存储。将知识资源从物理上进行分割分布式保存到不同存储空间中,并采用数据压缩技术进行存储,以此满足海量知识资源的存储需求。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈