专利汇可以提供基于WCUR算法的知识库补全方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于WCUR 算法 的 知识库 补全方法,包括以下步骤:步骤S1:遍历整个知识库,获取实体和关系的上下文信息;步骤S2:在考虑单独三元组的 基础 上结合上一阶段的实体和关系的上下文信息,分别计算三元组 置信度 的三个部分P(h|Neighbor(h))、P(t|Neighbor(t))和P(r|Path(r));步骤S3:通过梯度下降算法优化目标函数,反向更新每个实体和关系的向量,得到最优表示;步骤S4:根据最优表示,得到新的知识,并添加至原始知识库,实现知识库补全。本发明能够结合概率嵌入模型以衡量每个三元组的置信度,为每个实体和关系学习到更好的低维向量表示,更高效的补全知识库。,下面是基于WCUR算法的知识库补全方法专利的具体信息内容。
1.一种基于WCUR算法的知识库补全方法,其特征在于,包括以下步骤:
步骤S1:遍历整个知识库,获取实体和关系的上下文信息;
步骤S2:在考虑单独三元组的基础上结合上一阶段的实体和关系的上下文信息,分别计算三元组置信度的三个部分P(h|Neighbor(h))、P(t|Neighbor(t))和P(r|Path(r));
步骤S3:通过梯度下降算法优化目标函数,反向更新每个实体和关系的向量,得到最优表示;
步骤S4:根据最优表示,得到新的知识,并添加至原始知识库,实现知识库补全。
2.根据权利要求1所述的基于WCUR算法的知识库补全方法,其特征在于,所述步骤S2具体为:
步骤S21:根据TransE的平移不变性假设为每个三元组定义的一个基本的得分函数,以衡量h+r和t之间的不相似性,如式(1)所示:
其中γ是一个超参;
步骤S22:一个事实三元组(h,r,t)的置信度认为是头实体h、关系r和尾实体t的联合概率,P(h|Neighbor(h))代表给定头实体h的实体上下文Neighbor(h)的情况下头实体h出现的概率,一个事实三元组(h,r,t)的概率则可以定义为式(2):
步骤S223:通过替换任一元素之后组成知识库中不存在的事实三元组作为负例三元组,其中,所有替换头实体h组成的集合表示为Neg(?,r,t),所有替换的关系r组成的集合表示为Neg(h,?,t),所有替换的尾实体t组成的集合表示为Neg(h,r,?)。Neighbor(h)为给定头实体h的实体上下文,P(h|Neighbor(h))表示在h的实体上下文出现的情况下h出现的概率,则P(h|Neighbor(h))的计算如式(3)所示:
其中,αh(h,ri,ti)代表头实体h的实体上下文对(ri,ti)下(h,ri,ti)成立概率的归一化权重,如式(4)所示:
步骤S24:类似的,得到在尾实体t的实体上下文Neighbor(t)出现的情况下t出现的概率P(t|Neighbor(t)),αt(hi,ri,t)代表尾实体t的实体上下文对(hi,ri)下(hi,ri,t)成立概率的归一化权重,计算方式为式(5)和(6)所示。
步骤S25:引入关系r的上下文信息Path(r),计算方式如式(7)所示:
其中,Path(r)={r1,…,ri}表示关系r的关系上下文有i条不同的路径,ri={ri1,…,rik}为其中一条关系路径ri的k跳路径集合;当关系路径的长度为1时,该关系向量即为关系路径的向量;当关系路径的长度大于1时,关系路径的向量则为该条路径上所有关系的向量和;αr(h,ri,t)的值为当前考虑关系和其关系上下文的归一化权重,其中λ是一个超参。
3.根据权利要求2所述的基于WCUR算法的知识库补全方法,其特征在于:所述关系路径ri的向量计算如式(8)所示:
采用语义相似度来度量关系r和关系路径{ril,…,rik}间的紧密程度,语义相似度的计算公式为:||r-(ri1+...+rik)||,即二者语义越相似,向量距离越接近。
4.根据权利要求2所述的基于WCUR算法的知识库补全方法,其特征在于:所述αr(h,ri,t)计算如式(9)所示:
5.根据权利要求2所述的基于WCUR算法的知识库补全方法,其特征在于:所述步骤S3具体如下:
步骤S31:模型嵌入的最终目的是学习合适的向量表示三元组的置信度同时最小化预测的三元组置信度和真实三元组置信度之间的差值损失,优化目标公式为:
(h,r,t,ω)为不确定知识网络训练集中由三元组(h,r,t)及其置信度权值组成的事实四元组Q=(h,r,t,ω)构成的集合,P(h,r,t)即为式(2)的计算结果,损失函数为最小化预测的三元组的置信度P(h,r,t)与真实的三元组置信度ω之间的差值;
步骤S32:将计算量庞大的softmax归一化项近似转化为对数函数计算,得到式(11)~(13):
以给定头实体h的上下文下Neighbor(h)下h出现的条件概率为例,计算公式如下:
σ(x)是sigmod函数,计算方式为σ(x)=1/(1+exp-x);n为负采样个数,表示对每个正例三元组进行采样n个负例,同样的得到logP(t|Neighbor(t))及logP(r|Path(r)),最后的优化目标函数转换为式(13):
步骤S33:通过该优化目标函数进行负采样训练;
步骤S34:通过梯度下降算法,利用公式(11)~(13)进行梯度下降更新向量以达到最优化训练。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种人眼虹膜检测方法和装置 | 2020-05-08 | 507 |
一种基于机器学习的适用于径流资料缺乏流域的洪水预报方法 | 2020-05-11 | 982 |
一种航空器地面指挥信号训练系统及其操作方法 | 2020-05-12 | 993 |
一种基于知识图谱的组合错题推荐方法 | 2020-05-13 | 350 |
一种用于5G系统的智慧组网方法 | 2020-05-08 | 116 |
一种组合深度学习和概念图谱的电力故障事件抽取方法 | 2020-05-08 | 674 |
一种基于深度学习的多组学智能诊断系统 | 2020-05-11 | 923 |
一种基于非局部网络的视频压缩失真复原方法及系统 | 2020-05-13 | 529 |
一种交直流电网运行数据的属性标定方法及系统 | 2020-05-12 | 806 |
一种迭代的神经网络批量规范化系统 | 2020-05-12 | 705 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。