首页 / 专利库 / 图形技术 / 可视化 / 知识可视化 / 一种基于语义关注度模型的知识图谱可视化方法

一种基于语义关注度模型的知识图谱可视化方法

阅读:832发布:2020-05-15

专利汇可以提供一种基于语义关注度模型的知识图谱可视化方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于语义关注度模型的知识图谱 可视化 方法,用多层次多 角 度知识语义相似性距离度量结合用户语义关注度模型,提供一种 知识可视化 解决方案,从而支持全局+局部结构的可视化方法。本发明通过建立知识空间中知识对象间的语义关注度模型,计算焦点对象与知识空间中知识对象间的语义关注度;根据语义关注度进行知识图谱可视化展示。本发明在对复杂战场态势 大数据 分析与处理时,将语义距离较近的信息对象突出并主动呈现给用户,有助于智能化地辅助用户检索复杂的大数据知识,让用户不仅可以看到感兴趣对象的局部细节,同时保留其周围信息的整体 印象 ,在大数据知识图谱检索应用方面提供了良好的可视化支持。,下面是一种基于语义关注度模型的知识图谱可视化方法专利的具体信息内容。

1.一种基于语义关注度模型的知识图谱可视化方法,其特征在于,所述方法包括:
(1)建立知识空间中任一知识对象x对于f的语义关注度模型,其中所述语义关注度定义为:Sf(x|f)=ω1P(x)-ω2Sd(f,x),其中Sf(x|f)>r,P(x)是x的先验重要程度,Sd(f,x)是x与f之间的语义距离,r为关注度阈值,ω1和ω2分别是P(x)和Sd(f,x)的权重系数;
(2)选定焦点对象f,根据步骤(1)中的语义关注度模型计算焦点对象f与知识空间中任一知识对象x间的语义关注度;
(3)根据所述焦点对象f与知识空间中任一知识对象x间的语义关注度进行知识图谱可视化展示。
2.如权利要求1所述的基于语义关注度模型的知识图谱可视化方法,其特征在于,所述P(x)是x的先验重要程度,即用户在可视化分析过程中会对认为重要的可视化表征进行的标记,将先验重要度赋予了相应的信息对象。
3.如权利要求1或2所述的基于语义关注度模型的知识图谱可视化方法,其特征在于,所述Sd(f,x)定义为:
Sd(f,x)=α1·Inf(f,x)+α2·D(f,x)
其中,Inf(f,x)表示知识对象的特征因素,即知识图谱中的多层次和多度特征相似性,用以确定x与f之间的关联关系,D(f,x)是x与f的可视化表征中心之间的几何坐标距离,α1和α2分别是Inf(f,x)和D(f,x)的权重系数。
4.如权利要求3所述的基于语义关注度模型的知识图谱可视化方法,其特征在于,所述Inf(f,x)的定义为:
Inf(f,x)=max{f1(f,x),f2(f,x),f3(f,x)}
其中,f1(f,x)为知识对象的事件语义层次相似性度量,f2(f,x)为知识对象的概念语义层次相似性度量,f3(f,x)为知识对象的底层词汇语义层次相似性度量 知识对象在知识图谱中已被标记语义层次属性,即在事件、概念和底层词汇三个语义层次上具备至少一个语义层次的属性,不具备的语义层次属性项计算时置0。
5.如权利要求4所述的基于语义关注度模型的知识图谱可视化方法,其特征在于,f1(f,x)=max(Ex,f,Mx,f,Cx,f),其中Ex,f为x与f之间的欧式距离,Mx,f,为x与f之间的曼哈顿距离,Cx,f为x与f之间的余弦距离。
6.如权利要求4所述的基于语义关注度模型的知识图谱可视化方法,其特征在于,f2(f,x)=γDx,f+(1-γ)Sx,f,其中γ∈(0,1),其中Dx,f为x与f两个概念的特征词汇向量间的相似性距离,Sx,f为x与f两个概念的语义关联结构图的图相似性。
7.如权利要求6所述的基于语义关注度模型的知识图谱可视化方法,其特征在于,所述Sx,f的定义为:
其中, 公式前半部分是对Gx、Gf中节点相似性度量,Gx、Gf的最大公共子图g
(x,f)的节点数越多,与Gx、Gf的节点数越接近,则说明Gx、Gf节点相似度越高;公式前半部分是对Gx、Gf中边的相似性度量,最大公共子图中边的条数越多,说明Gx、Gf相同边数越多,相同边数与Gx、Gf的边数越接近,说明Gx、Gf边的相似度越高。
8.如权利要求5所述的基于语义关注度模型的知识图谱可视化方法,其特征在于,x与f之间的欧式距离Ex,f为: 其中,
x与f之间的曼哈顿距离Mx,f,为: 其中,
x与f之间的余弦距离Cx,f为:
其中, 为x的时间特征向量, 为x的地理特征向量, 为x的语义特征向量, 为f的时间特征向量, 为f的地理特征向量, 为f的语义特征向量。
9.如权利要求8所述的基于语义关注度模型的知识图谱可视化方法,其特征在于,时间特征向量和地理特征向量的定义为:将知识实体x按平均取m个点得到时刻点(t1,t2,t3......tm),时刻点对应的地理位置是(d1,d2,d3......dm),将上述数字向量直接作为知识实体的时间特征向量 和地理特征向量 语义特征向量的定义为:将知识实体分词为固定长度的词向量,采用词向量之和作为知识实体的语义特征向量。
10.如权利要求1或2所述的基于语义关注度模型的知识图谱可视化方法,其特征在于,所述方法还包括:
在知识图谱可视化展示结果中选择新的焦点对象f′,计算新的焦点对象f′与知识空间中任一知识对象x间的语义关注度,根据所述新的焦点对象f′与知识空间中任一知识对象x间的语义关注度进行知识图谱可视化展示。

说明书全文

一种基于语义关注度模型的知识图谱可视化方法

技术领域

[0001] 本发明属于大数据知识可视化技术领域,更具体地,涉及一种基于语义关注度模型的知识图谱可视化方法。

背景技术

[0002] 开放动态环境下带有时空属性的大数据知识在时间、空间和属性三个方面的固有特征,呈现出多度、多层次的复杂性。并且其知识数据规模庞大,数据结构纷繁复杂,如何在知识检索可视化界面中将语义距离较近的知识实体突出呈现给用户,辅助用户对知识的认知,成为一个关键问题。同时,用户在进行知识检索时,在有限的屏幕上放大推荐结果细节时,常常会丢失全局信息。
[0003] 国内外研究者们设计了一些数据可视化模型,但并没有为用户提供全局与局部相配合的展示方式。因此对异构、动态作战数据的可视化主要解决的问题是:如何有效地提取满足分析者需求和感兴趣区域的时空关系,并对用户关注的局部结构信息以及全局结构进行多层次和多角度的合理展现。

发明内容

[0004] 针对现有技术的以上缺陷或改进需求,本发明提供了一种基于语义关注度模型的知识图谱可视化方法,其目的在于结合多层次多角度知识相似度计算的方法建立语义关注度模型并进行可视化展示,由此解决现有技术中无法对用户关注的局部结构信息以及全局结构进行多层次和多角度的合理展现的技术问题。
[0005] 为实现上述目的,本发明提供了一种基于语义关注度模型的知识图谱可视化方法,包括:
[0006] (1)建立知识空间中任一知识对象x对于f的语义关注度模型,其中所述语义关注度定义为:Sf(x|f)=ω1P(x)-ω2Sd(f,x),其中Sf(x|f)>r,P(x)是x的先验重要程度,Sd(f,x)是x与f之间的语义距离,r为关注度阈值,ω1和ω2分别是P(x)和Sd(f,x)的权重系数;
[0007] (2)选定焦点对象f,根据步骤(1)中的语义关注度模型计算焦点对象f与知识空间中任一知识对象x问的语义关注度;
[0008] (3)根据所述焦点对象f与知识空间中任一知识对象x间的语义关注度进行知识图谱可视化展示。
[0009] 本发明的一个实施例中,所述P(x)是x的先验重要程度,即用户在可视化分析过程中会对认为重要的可视化表征进行的标记,将先验重要度赋予了相应的信息对象。
[0010] 本发明的一个实施例中,所述Sd(f,x)定义为:
[0011] Sd(f,x)=α1·Inf(f,x)+α2·D(f,x)
[0012] 其中,Inf(f,x)表示知识对象的特征因素,即知识图谱中的多层次和多角度特征相似性,用以确定x与f之间的关联关系,D(f,x)是x与f的可视化表征中心之间的几何坐标距离,α1和α2分别是Inf(f,x)和D(f,x)的权重系数。
[0013] 本发明的一个实施例中,所述Inf(f,x)的定义为:
[0014] Inf(f,x)=max{f1(f,x),f2(f,x),f3(f,x)}
[0015] 其中,f1(f,x)为知识对象的事件语义层次相似性度量,f2(f,x)为知识对象的概念语义层次相似性度量,f3(f,x)为知识对象的底层词汇语义层次相似性度量 知识对象在知识图谱中已被标语义记层次属性,即在事件、概念和底层词汇三个语义层次上具备至少一个语义层次的属性,不具备的语义层次属性项计算时置0。例如知识对象“珍珠港事件”,同时具备事件语义层次属性和概念语义层次属性。
[0016] 本发明的一个实施例中,f1(f,x)=max(Ex,f,Mx,f,Cx,f),其中Ex,f为x与f之间的欧式距离,Mx,f,为x与f之间的曼哈顿距离,Cx,f为x与f之间的余弦距离。
[0017] 本发明的一个实施例中,f2(f,x)=γDx,f+(1-γ)Sx,f,其中γ∈(0,1),其中Dx,f为x与f两个概念的特征词汇向量间的相似性距离,Sx,f为x与f两个概念的语义关联结构图的图相似性。。
[0018] 本发明的一个实施例中,所述Sx,f的定义为:
[0019]
[0020] 其中, 公式前半部分是对Gx、Gf中节点相似性度量,Gx、Gf的最大公共子图g(x,f)的节点数越多,与Gx、Gf的节点数越接近,则说明Gx、Gf节点相似度越高;公式前半部分是对Gx、Gf中边的相似性度量,最大公共子图中边的条数越多,说明Gx、Gf相同边数越多,相同边数与Gx、Gf的边数越接近,说明Gx、Gf边的相似度越高。
[0021] 本发明的一个实施例中,x与f之间的欧式距离Ex,f为:其中, x与f之间的曼哈顿距离Mx,f,为: 其中,
x与f之间的余弦距离Cx,f为: 其中,为x的时间特征向
量,为x的地理特征向量,为x的语义特征向量, 为f的时间特征向量, 为f的地理特征向量, 为f的语义特征向量。
[0022] 本发明的一个实施例中,时间特征向量和地理特征向量的定义为:将知识实体x按平均取m个点得到时刻点(t1,t2,t3......tm),时刻点对应的地理位置是(d1,d2,d3......dm),将上述数字向量直接作为知识实体的时间特征向量 和地理特征向量 语义特征向量的定义为:将知识实体分词为固定长度的词向量,采用词向量之和作为知识实体的语义特征向量。
[0023] 本发明的一个实施例中,所述方法还包括:在知识图谱可视化展示结果中选择新的焦点对象f′,计算新的焦点对象f′与知识空间中任一知识对象x间的语义关注度,根据所述新的焦点对象f′与知识空间中任一知识对象x间的语义关注度进行知识图谱可视化展示。
[0024] 总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有如下有益效果:
[0025] 本发明提出了一种基于用户视角驱动的语义关注度模型,该模型基于人类认知心理的一个基本特点:人在认知所关注局部结构知识详细信息的同时,通常还需保留全局结构尤其是关注部分上下文信息的可见性和连贯性。同时,在可视化界面的实体排布时,实体之间的语义距离不仅取决于它们的可视化表征在界面中的空间距离的远近,还与用户探索信息的任务目标以及意图密切相关。本发明通过结合多层次多角度知识相似度计算的方法建立语义关注度模型,对多层次多角度知识的局部结构进行缩放,将用户所关注的局部结构的细节信息突出放大,焦点周围的部分的细节信息随着距离渐远而逐渐缩小。通过本发明方法,能够实现将用户关注的焦点对象布局在界面中央,同时实时地根据焦点的变化计算其上下文对象集合,呈现给用户动态可视化的推荐结果,让用户不仅可以看到感兴趣对象的局部细节,同时保留其周围信息的整体印象附图说明
[0026] 图1是本发明实施例中用于知识图谱可视化的语义关注度模型的构建示意图;
[0027] 图2(a)是本发明实施例中对于知识实体“福特号”的知识图谱检索展示结果;
[0028] 图2(b)是本发明实施例中将知识实体由“福特号”切换为“防御武器装备”的知识图谱检索展示结果。

具体实施方式

[0029] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0030] 为了解决现有技术所存在的问题,如图1所示,本发明提供了一种基于语义关注度模型的知识图谱可视化方法,具体步骤包括:
[0031] (1)建立知识空间中任一知识对象x对于f的语义关注度模型,其中所述语义关注度定义为:Sf(x|f)=ω1P(x)-ω2Sd(f,x),其中Sf(x|f)>r,P(x)是x的先验重要程度,Sd(f,x)是x与f之间的语义距离,r为关注度阈值,ω1和ω2分别是P(x)和Sd(f,x)的权重系数;
[0032] 具体地,所述语义关注度模型的建立过程为:
[0033] a、从事件语义层次计算知识实体相似性距离。
[0034] b:从概念语义层次计算知识实体相似性距离。
[0035] c:从底层词汇语义层次计算知识实体相似性距离。
[0036] d:依据步骤a、b、c中形成的距离度量,建立语义关注度模型。
[0037] 对于事件类的知识实体(例如“珍珠港事件”“国产航母首次下”),进行事件语义层次相似性计算,主要根据事件的多角度特征:语义特征、时间特征、地理位置特征使用不同的相似性计算策略。首先将事件的三个不同空间特征映射到欧几里德空间中。然后,使用不同的相似性计算策略,例如:
[0038] 知识实体“某船只今天运送物资”按平均取m个点得到时刻点(t1,t2,t3......tm),时刻点对应的地理位置是(d1,d2,d3......dm),将上述数字向量直接作为知识实体的时间特征向量 和地理特征向量 同时,利用word2vec将事件分词为固定长度的词向量(今天船 只 运 送 物资 ) ,采 用词向量 之和 作为事 件的 表示向 量三种特征选择不同的相似性计算,例如另一个事件是“某船只今
晚巡视海域”对应的三个特征向量为 可以分别选择
[0039] 欧式距离:
[0040]
[0041] 其中,
[0042] 曼哈顿距离:
[0043]
[0044] 其中,
[0045] 余弦距离:
[0046]
[0047] 其中,为事件“某船只今天运送物资”的语义特征向量, 为事件“某船只今晚巡视海域”的语义特征向量。
[0048] 将上述三种距离取max值作为事件语义层次相似性距离,作为两个知识实体的事件语义层次的相似性度量。
[0049] 对于概念类的知识实体(例如“瓦良格号”“核武器”),进行概念语义层次相似性计算,概念语义层次相似性计算采用基于图相似性和向量相似性相结合的方法计算两个概念的相似性。以概念a、b为例,概念的文本长度通常都较短,采用word2vec方法生成固定长度(例如m维)的词向量来表示概念,如a的特征词汇向量为(a1,a2,......am),b特征词汇向量为(b1,b2,......bm)。
[0050] 首先基于两个概念的特征词汇向量,采用向量相似性计算方法,例如曼哈顿距离:
[0051]
[0052] 然后基于两个概念的特征词汇网络,采用基于最大公共子图的图匹配方法计算。以概念a、b为例,它们分别拥有语义关联结构图Ga、Gb,Ga、Gb的最大公共子图为g,记作g=g(a,b)。定义下式来计算Ga、Gb的图相似性:
[0053]
[0054] 其中, 公式前半部分是对Ga、Gb中节点相似性度量,Ga、Gb的最大公共子图g(a,b)的节点数越多,与Ga、Gb的节点数越接近,则说明节点相似度越高;同理,最大公共子图中边的条数越多,说明Ga、Gb相同边数越多,相同边数与Ga、Gb的边数越接近,说明Ga、Gb边的相似度越高。
[0055] 最后综合两步的结果
[0056] γDa,b+(1-γ)Sa,b
[0057] 其中γ∈(0,1),得到两个概念的相似性度量。
[0058] 对于底层词汇语义层次的特征词汇,即一些小的语言单位。首先通过word2vec模型将底层词汇表示为固定长度的向量;然后基于文本词汇语义特征的向量,采用余弦距离进行大数据知识中底层词汇语义层次相似性计算。
[0059] 例如底层词D1的向量补齐后表示为 底层词C1的向量表示为
[0060] 在用户使用知识图谱进行知识检索时,对于推荐结果中的若干知识实体中,关注的焦点对象f,定义知识空间中任一知识对象x与f之间的语义距离:
[0061] Sd(f,x)=α1·Inf(f,x)+α2·D(f,x)
[0062] Inf(f,x)表示知识对象的特征因素,即知识图谱中的多层次和多角度特征相似性,用以确定x与f之间的关联关系。
[0063] Inf(f,x)=max{f1(f,x),f2(f,x),f3(f,x)}
[0064] 其中,f1(f,x)为知识对象的事件语义层次相似性度量,f1(f,x)=max(Ex,f,Mx,f,Cx,f)。f2(f,x)为知识对象的概念语义层次相似性度量γDx,f+(1-γ)Sx,f,f3(f,x)为知识对象的底层词汇语义层次相似性度量 知识对象在知识图谱中已被标记语义层次属性,即在事件、概念和底层词汇三个语义层次上具备至少一个语义层次的属性,不具备的语义层次属性项计算时置0。例如知识对象“珍珠港事件”,同时具备事件语义层次属性和概念语义层次属性。
[0065] D(f,x)是当前x与f的可视化表征中心之间的几何坐标距离。
[0066] 通过对α1,α2的赋权,可计算基于多层次多角度大数据知识相似度距离。
[0067] Sd(f,x)为语义距离优势语义关注度模型的重要参数,用于度量x与f在语义层面的距离。
[0068] 定义了语义距离后,先验重要度、语义距离和关注度阈值组成语义关注度模型。在用户选定了焦点对象f的前提下,知识空间中任一知识对象x对于f的语义关注度可表示为:
[0069] Sf(x|f)=ω1P(x)-ω2Sd(f,x),
[0070] 其中Sf(x|f)>r
[0071] 其中,P(x)是x的先验重要程度,即用户在可视化分析过程中会对认为重要的可视化表征进行的标记,将先验重要度赋予了相应的信息对象:例如:
[0072] P(x)=1,若用户对x进行标记
[0073] P(x)=0.5,若用户未对x进行标记
[0074] Sd(f,x)是x与f之间的语义距离,如前所述。
[0075] ω1和ω2分别是P(x)和Sd(f,x)的权重系数;
[0076] r记为关注度阈值,阈值用于控制和调整交互过程中语义上下文信息的规模,对语义关注度模型所得出的信息对象集合予以限制。也即,只有语义关注度大于r的知识对象才会出现在用户的推荐结果页面上。
[0077] ω1和ω2分别是P(x)和Sd(f,x)的权重系数;
[0078] 上式表示语义关注度是语义距离Sd(f,x)的减函数,是先验重要程度P(x)的增函数,符合实际。
[0079] (2)选定焦点对象f,根据步骤(1)中的语义关注度模型计算焦点对象f与知识空间中任一知识对象x间的语义关注度;
[0080] Sf(x|f)=ω1P(x)-ω2Sd(f,x)
[0081] (3)根据所述焦点对象f与知识空间中任一知识对象x间的语义关注度进行知识图谱可视化展示。
[0082] 当然,进一步地,如果在知识图谱可视化展示结果中选择新的焦点对象f′,则计算新的焦点对象f′与知识空间中任一知识对象x间的语义关注度,并根据所述新的焦点对象f′与知识空间中任一知识对象x间的语义关注度进行知识图谱可视化展示。
[0083] 结合上述基于多角度多层次相似性距离的语义关注度模型,能够实现对可视化图像基于用户焦点变化的构建与调整。
[0084] 以下结合具体实施例对本发明技术方案进行进一步说明:
[0085] 本发明基于焦点上下文的知识检索可视化推荐方法组成主要有多层次多角度大数据知识语义距离计算、用户语义关注度模型构建两部分:
[0086] 语义距离计算:
[0087] 多层次多角度大数据知识相似度计算的主要作用是为可视化推荐构建具有不同层次的相似性知识图谱。例如用户输入“福特号”查询美军福特号航空母舰的相关知识,相关知识具有多层次(概念、事件、底层词汇)和多角度(时间、地理、对象)的特点。
[0088] 用户输入查询关键词;
[0089] 在知识图谱中对关键词“福特号”进行查询,获取包含关键词“福特号”的三元组及关系;
[0090] 对于查询关键词相关实体及推荐结果,通过步骤a、b、c、d中的相似性计算过程,得出知识实体之间的语义距离。
[0091] 用户语义关注度模型
[0092] 用户输入查询关键词“福特号”之后,检索系统给出推荐图,如图2(a)所示的全局效果。用户在进一步浏览所需知识时,所关注的焦点对象可能发生变化,譬如从视角中心切换到右上角的“防御武器装备”,此时用户语义关注度模型将调整推荐布局。
[0093] 用户切换关注焦点,焦点信息对象f由图2(a)中心的“福特号”转移为“防御武器装备”;
[0094] 对于新的焦点信息对象f“防御武器装备”,计算信息空间中信息对象x与f的语义距离Sd(f,x)以及x对于f的语义关注度Sf(x|f),调整视图展示界面(展示哪些结果、结果的图像大小与远近)。示意参见图2(b)。
[0095] 本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈