首页 / 专利库 / 电脑编程 / 临时别名 / 事件主体的生成方法及其装置

事件主体的生成方法及其装置

阅读:432发布:2020-05-11

专利汇可以提供事件主体的生成方法及其装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种事件主体的生成方法及其装置。其中,方法包括:获取与事件相关的多个资讯信息,分别从每个资讯信息中提取出对应的多个实体。从知识图谱中获取多个实体对应的 属性信息 ,根据资讯信息和多个实体对应的属性信息,确定资讯信息对应的资讯主体。根据多个资讯主体,生成事件的事件主体。由此,实现了充分利用知识图谱中记载的属性信息,结合资讯信息,确定资讯信息对应的资讯主体,进而生成事件的事件主体,提高了生成事件主体的准确度。解决了 现有技术 中生成事件主体的准确度较差的技术问题。,下面是事件主体的生成方法及其装置专利的具体信息内容。

1.一种事件主体的生成方法,其特征在于,包括:
获取事件的多个资讯信息;
分别从每个所述资讯信息中提取出对应的多个实体;
从知识图谱中获取所述多个实体对应的属性信息
根据所述资讯信息和所述多个实体对应的属性信息,确定所述资讯信息对应的资讯主体;以及
根据多个所述资讯主体,生成所述事件的事件主体。
2.如权利要求1所述的生成方法,其特征在于,所述属性信息包括结点信息和边信息,所述从知识图谱中获取所述多个实体对应的属性信息,包括:
获取所述多个实体在所述知识图谱中分别对应的多个结点,并分别获取所述多个结点对应的多个结点信息;
获取所述多个结点之间的边,并分别获取所述多个结点之间的边对应的边信息。
3.如权利要求2所述的生成方法,其特征在于,所述根据所述资讯信息和所述多个实体对应的属性信息,确定所述资讯信息对应的资讯主体,包括:
提取所述结点信息中的背景信息;
根据所述背景信息确定所述实体和所述资讯信息的第一相关度;
根据所述边信息,确定所述多个实体之间的关系强度,并根据所述关系强度确定所述多个实体之间的第二相关度;
根据所述第一相关度和所述第二相关度,确定所述资讯信息对应的资讯主体。
4.如权利要求3所述的生成方法,其特征在于,所述根据所述第一相关度和所述第二相关度,确定所述资讯信息对应的资讯主体,包括:
根据所述第一相关度和所述第二相关度,分别计算所述多个实体的权重得分;
根据所述多个实体的权重得分对所述多个实体进行排序,以确定所述资讯信息对应的资讯主体。
5.如权利要求1所述的生成方法,其特征在于,所述根据多个所述资讯主体,生成所述事件的事件主体,包括:
分别获取所述多个资讯信息的热度和来源;
根据所述多个资讯信息的热度和来源,分别计算所述多个资讯信息对应的权重值;
根据所述资讯信息对应的权重值和所述多个实体的权重得分,计算所述多个实体对应的合并权重得分;
分别获取多个所述资讯主体中的多个实体,并根据所述合并权重得分对所述多个资讯主体中的多个实体进行排序,以生成所述事件主体。
6.如权利要求1-5中任一项所述的生成方法,在所述根据所述资讯信息和所述多个实体对应的属性信息,确定所述资讯信息对应的资讯主体之前,还包括:
对所述资讯信息进行指代求解和别名求解,以将所述资讯信息中的代词和别名替换为所述实体。
7.一种事件主体的生成装置,其特征在于,包括:
第一获取模,用于获取事件的多个资讯信息;
提取模块,用于分别从每个所述资讯信息中提取出对应的多个实体;
第二获取模块,用于从知识图谱中获取所述多个实体对应的属性信息;
确定模块,用于根据所述资讯信息和所述多个实体对应的属性信息,确定所述资讯信息对应的资讯主体;以及
生成模块,用于根据多个所述资讯主体,生成所述事件的事件主体。
8.如权利要求7所述的生成装置,其特征在于,所述属性信息包括结点信息和边信息,所述第二获取模块,包括:
第一获取子模块,用于获取所述多个实体在所述知识图谱中分别对应的多个结点;
第二获取子模块,用于分别获取所述多个结点对应的多个结点信息;
第三获取子模块,用于获取所述多个结点之间的边;
第四获取子模块,用于分别获取所述多个结点之间的边对应的边信息。
9.如权利要求8所述的生成装置,其特征在于,所述确定模块,包括:
提取子模块,用于提取所述结点信息中的背景信息;
第一确定子模块,用于根据所述背景信息确定所述实体和所述资讯信息的第一相关度;
第二确定子模块,用于根据所述边信息,确定所述多个实体之间的关系强度;
第三确定子模块,用于根据所述关系强度确定所述多个实体之间的第二相关度;
第四确定子模块,用于根据所述第一相关度和所述第二相关度,确定所述资讯信息对应的资讯主体。
10.如权利要求9所述的生成装置,其特征在于,所述第四确定子模块,包括:
计算单元,用于根据所述第一相关度和所述第二相关度,分别计算所述多个实体的权重得分;
排序单元,用于根据所述多个实体的权重得分对所述多个实体进行排序,以确定所述资讯信息对应的资讯主体。
11.如权利要求7所述的生成装置,其特征在于,所述生成模块,包括:
第五获取子模块,用于分别获取所述多个资讯信息的热度和来源;
第一计算子模块,用于根据所述多个资讯信息的热度和来源,分别计算所述多个资讯信息对应的权重值;
第二计算子模块,用于根据所述资讯信息对应的权重值和所述多个实体的权重得分,计算所述多个实体对应的合并权重得分;
第六获取子模块,用于分别获取多个所述资讯主体中的多个实体;
排序子模块,用于根据所述合并权重得分对所述多个资讯主体中的多个实体进行排序,以生成所述事件主体。
12.如权利要求7-11中任一项所述的生成装置,其特征在于,所述装置还包括:
求解模块,用于对所述资讯信息进行指代求解和别名求解,以将所述资讯信息中的代词和别名替换为所述实体。
13.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令处理器执行时实现如权利要求1-6中任一项所述的事件主体的生成方法。
14.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的事件主体的生成方法。

说明书全文

事件主体的生成方法及其装置

技术领域

[0001] 本发明涉及信息检索技术领域,尤其涉及一种事件主体的生成方法及其装置。

背景技术

[0002] 互联网时代海量的资讯信息让用户无法高效地获得与目标事件相关的资讯信息,因此需要对海量的资讯信息进行整理,将与目标事件相关的资讯信息以事件主体的形式提供给用户。其中,事件主体是指与目标事件相关的命名名称列表,命名名称包括人名、地名、组织机构名等,且该命名名称列表中的命名名称按照相对目标事件的重要程度降序排列。
[0003] 为了实现通过事件主体获得相关资讯信息,可以首先确定目标事件的事件主体,再根据将相关的资讯信息与事件主体中的命名名称相连,从而实现通过事件主体反向索引相关的资讯信息。
[0004] 相关技术中,从资讯信息中提取命名名称作为实体,根据频率等统计特征确定实体在资讯信息中的重要性。根据提取出的实体和重要性,生成事件的事件主体。但是,没有考虑实体之间的相关度,导致生成事件主体的准确度较差,进而影响对相关的资讯信息的反向索引的准确度。

发明内容

[0005] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006] 为此,本发明的第一个目的在于提出一种事件主体的生成方法,以实现充分利用知识图谱中记载的属性信息,结合资讯信息,确定资讯信息对应的资讯实体,进而生成事件的事件主体,提高生成事件主体的准确度。
[0007] 本发明的第二个目的在于提出一种事件主体的生成装置。
[0008] 本发明的第三个目的在于提出一种计算机程序产品。
[0009] 本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
[0010] 为达上述目的,本发明第一方面实施例提出了一种事件主体的生成方法,包括:获取事件的多个资讯信息;分别从每个所述资讯信息中提取出对应的多个实体;从知识图谱中获取所述多个实体对应的属性信息;根据所述资讯信息和所述多个实体对应的属性信息,确定所述资讯信息对应的资讯主体;以及根据多个所述资讯主体,生成所述事件的事件主体。
[0011] 和现有技术相比,本发明实施例充分利用知识图谱中记载的属性信息,结合资讯信息,确定资讯信息对应的资讯主体,进而生成事件的事件主体,提高了生成事件主体的准确度。
[0012] 另外,本发明实施例的事件主体的生成方法,还具有如下附加的技术特征:
[0013] 可选地,所述属性信息包括结点信息和边信息,所述从知识图谱中获取所述多个实体对应的属性信息,包括:获取所述多个实体在所述知识图谱中分别对应的多个结点,并分别获取所述多个结点对应的多个结点信息;获取所述多个结点之间的边,并分别获取所述多个结点之间的边对应的边信息。
[0014] 可选地,所述根据所述资讯信息和所述多个实体对应的属性信息,确定所述资讯信息对应的资讯主体,包括:提取所述结点信息中的背景信息;根据所述背景信息确定所述实体和所述资讯信息的第一相关度;根据所述边信息,确定所述多个实体之间的关系强度,并根据所述关系强度确定所述多个实体之间的第二相关度;根据所述第一相关度和所述第二相关度,确定所述资讯信息对应的资讯主体。
[0015] 可选地,所述根据所述第一相关度和所述第二相关度,确定所述资讯信息对应的资讯主体,包括:根据所述第一相关度和所述第二相关度,分别计算所述多个实体的权重得分;根据所述多个实体的权重得分对所述多个实体进行排序,以确定所述资讯信息对应的资讯主体。
[0016] 可选地,所述根据多个所述资讯主体,生成所述事件的事件主体,包括:分别获取所述多个资讯信息的热度和来源;根据所述多个资讯信息的热度和来源,分别计算所述多个资讯信息对应的权重值;根据所述资讯信息对应的权重值和所述多个实体的权重得分,计算所述多个实体对应的合并权重得分;分别获取多个所述资讯主体中的多个实体,并根据所述合并权重得分对所述多个资讯主体中的多个实体进行排序,以生成所述事件主体。
[0017] 可选地,在所述根据所述资讯信息和所述多个实体对应的属性信息,确定所述资讯信息对应的资讯主体之前,还包括:对所述资讯信息进行指代求解和别名求解,以将所述资讯信息中的代词和别名替换为所述实体。
[0018] 本发明第二方面实施例提出了一种事件主体的生成装置,包括:第一获取模,用于获取事件的多个资讯信息;提取模块,用于分别从每个所述资讯信息中提取出对应的多个实体;第二获取模块,用于从知识图谱中获取所述多个实体对应的属性信息;确定模块,用于根据所述资讯信息和所述多个实体对应的属性信息,确定所述资讯信息对应的资讯主体;以及生成模块,用于根据多个所述资讯主体,生成所述事件的事件主体。
[0019] 可选地,所述属性信息包括结点信息和边信息,所述第二获取模块,包括:第一获取子模块,用于获取所述多个实体在所述知识图谱中分别对应的多个结点;第二获取子模块,用于分别获取所述多个结点对应的多个结点信息;第三获取子模块,用于获取所述多个结点之间的边;第四获取子模块,用于分别获取所述多个结点之间的边对应的边信息。
[0020] 可选地,所述确定模块,包括:提取子模块,用于提取所述结点信息中的背景信息;第一确定子模块,用于根据所述背景信息确定所述实体和所述资讯信息的第一相关度;第二确定子模块,用于根据所述边信息,确定所述多个实体之间的关系强度;第三确定子模块,用于根据所述关系强度确定所述多个实体之间的第二相关度;第四确定子模块,用于根据所述第一相关度和所述第二相关度,确定所述资讯信息对应的资讯主体。
[0021] 可选地,所述第四确定子模块,包括:计算单元,用于根据所述第一相关度和所述第二相关度,分别计算所述多个实体的权重得分;排序单元,用于根据所述多个实体的权重得分对所述多个实体进行排序,以确定所述资讯信息对应的资讯主体。
[0022] 可选地,所述生成模块,包括:第五获取子模块,用于分别获取所述多个资讯信息的热度和来源;第一计算子模块,用于根据所述多个资讯信息的热度和来源,分别计算所述多个资讯信息对应的权重值;第二计算子模块,用于根据所述资讯信息对应的权重值和所述多个实体的权重得分,计算所述多个实体对应的合并权重得分;第六获取子模块,用于分别获取多个所述资讯主体中的多个实体;排序子模块,用于根据所述合并权重得分对所述多个资讯主体中的多个实体进行排序,以生成所述事件主体。
[0023] 可选地,所述装置还包括:求解模块,用于对所述资讯信息进行指代求解和别名求解,以将所述资讯信息中的代词和别名替换为所述实体。
[0024] 本发明第三方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时实现如前述方法实施例所述的事件主体的生成方法。
[0025] 本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述方法实施例所述的事件主体的生成方法。
[0026] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。附图说明
[0027] 图1为本发明实施例所提供的一种事件主体的生成方法的流程示意图;
[0028] 图2为本发明实施例所提供的一种可能的中文命名实体识别的方式的效果示意图;
[0029] 图3为本发明实施例所提供的将实体和结点信息相关联的一个示例的效果示意图;
[0030] 图4为本发明实施例所提供的另一种事件主体的生成方法的流程示意图;
[0031] 图5为本发明实施例所提供的根据资讯信息生成资讯主体的一个示例的效果示意图;
[0032] 图6为本发明实施例所提供的又一种事件主体的生成方法的流程示意图;
[0033] 图7为本发明实施例所提供的事件主体的生成方法的一个示例的流程图
[0034] 图8为本发明实施例所提供的一种事件主体的生成装置的结构示意图;
[0035] 图9为本发明实施例所提供的另一种事件主体的生成装置的结构示意图;以及[0036] 图10为本发明实施例所提供的又一种事件主体的生成装置的结构示意图。

具体实施方式

[0037] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0038] 下面参考附图描述本发明实施例的事件主体的生成方法及其装置。
[0039] 基于上述现有技术的描述可以知道,相关技术中,从资讯信息中提取命名名称作为实体,根据频率等统计特征确定实体在资讯信息中的重要性。根据提取出的实体和重要性,生成事件的事件主体。但是,没有考虑实体之间的相关度,导致生成事件主体的准确度较差,进而影响对相关的资讯信息的反向索引的准确度。
[0040] 针对这一问题,本发明实施例提供了一种事件主体的生成方法。利用知识图谱中记载的属性信息,结合资讯信息,确定资讯信息对应的资讯主体,进而生成事件的事件主体,提高了生成事件主体的准确度。
[0041] 图1为本发明实施例所提供的一种事件主体的生成方法的流程示意图。如图1所示,该方法包括以下步骤:
[0042] S101,获取事件的多个资讯信息。
[0043] 其中,事件的多个资讯信息是通过信息挖掘的方式,从多种信息渠道中获取的与事件相关的资讯信息。比如通过爬虫从各大网站抓取与事件相关的资讯信息。
[0044] 一种优选的实现方式是,对抓取的资讯信息按照发布时间进行筛选,只选取特定时间段内的资讯信息,比如筛选出事件发生24小时内发布的资讯信息,根据筛选出的资讯信息建立该事件的资讯信息库。
[0045] 相应地,本发明实施例生成的事件主体可以作为该资讯信息库的索引。
[0046] S102,分别从每个资讯信息中提取出对应的多个实体。
[0047] 其中,实体是资讯信息中的命名名称,包括人名、地名、组织结构名。
[0048] 具体地,可以分别对每个资讯信息进行中文命名实体识别,从每个资讯信息中提取出多个命名名称,作为该资讯信息对应的多个实体。
[0049] 需要说明的是,本发明实施例提供的一种可能的中文命名实体识别的方式是,使用基于字的序列标注方法,采用BIO标注集,对资讯信息进行标注。具体地,将人名首字和人名非首字分别用B-PER和I-PER标注,将地名首字和地名非首字分别用B-LOC和I-LOC标注,将组织机构名首字和组织结构名非首字分别用B-ORG和I-ORG标注,将不属于命名名称的字用O标注。举例来说,如图2所示,在资讯信息“武磊帮助上海上港贡献两颗进球”中,“武磊”是人名,“上海上港”是组织机构名,由此可以从资讯信息中提取出实体“武磊”、“上海上港”。
[0050] S103,从知识图谱中获取多个实体对应的属性信息。
[0051] 应当理解,知识图谱由结点和边组成,每一个结点对应着结点信息,结点之间通过边相连,每一条边对应着边信息。因此,知识图谱中的属性信息包括点信息和边信息。
[0052] 需要说明的是,S102中提取出的多个实体,对应着知识图谱中的多个结点。相应地,S102中多个实体之间的关系,对应着知识图谱中多个结点之间的边。
[0053] 因此,要从知识图谱中获取多个实体对应的属性信息,一种可能的实现方式是,获取多个实体在知识图谱中分别对应的多个结点,并分别获取多个结点对应的多个结点信息。获取多个结点之间的边,并分别获取多个结点之间的边对应的边信息。
[0054] 从而,将获取的结点信息与实体相关联,将获取的边信息与实体之间的关系相关联。
[0055] 为了更加清楚地说明本发明实施例所提供的事件主体的生成方法是如何将结点信息与实体相关联的,下面以维基百科(为了便于说明,用维基百科页面代替结点信息)为例进行说明。
[0056] 如图3所示,在维基百科中的百度公司介绍信息中,设置了Robin Li这一实体与Robin Li的维基百科页面相关联,点击百度公司介绍信息中的Robin Li,即可跳转到Robin Li的维基百科页面。本发明实施例中采用了相同的技术将实体与结点信息相关联,类似的,将边信息与实体之间的关系相关联。
[0057] S104,根据资讯信息和多个实体对应的属性信息,确定资讯信息对应的资讯主体。
[0058] 需要说明的是,资讯信息作为一种自由文本,包含很多代词和别名,为了便于后续处理,一种可能的实现方式是,在根据资讯信息和多个实体对应的属性信息,确定资讯信息对应的资讯主体之前,对资讯信息进行指代求解和别名求解,以将资讯信息中的代词和别名替换为实体。
[0059] 应当理解的是,在获取多个实体对应的属性信息之后,可以根据属性信息判断实体与资讯信息的相关度,进而确定资讯信息对应的资讯主体。
[0060] S105,根据多个资讯主体,生成事件的事件主体。
[0061] 应当理解,每个资讯对应着各自的资讯主体,而事件包括多个资讯,因此需要将多个资讯主体进行合并,才能得到事件的事件主体。
[0062] 综上所述,本发明实施例所提供的事件主体的生成方法,获取与事件相关的多个资讯信息,分别从每个资讯信息中提取出对应的多个实体。从知识图谱中获取多个实体对应的属性信息,根据资讯信息和多个实体对应的属性信息,确定资讯信息对应的资讯主体。根据多个资讯主体,生成事件的事件主体。由此,实现了充分利用知识图谱中记载的属性信息,结合资讯信息,确定资讯信息对应的资讯主体,进而生成事件的事件主体,提高了生成事件主体的准确度。
[0063] 为了更加清楚地说明本发明实施例所提供的事件主体的生成方法是如何确定资讯信息对应的资讯主体的,本发明实施例还提出了另一种事件主体的生成方法。图4为本发明实施例所提供的另一种事件主体的生成方法的流程示意图,如图4所示,基于图1所示的方法流程,S104根据资讯信息和多个实体对应的属性信息,确定资讯信息对应的资讯主体,包括:
[0064] S201,提取结点信息中的背景信息。
[0065] 应当理解,结点信息中包含各种信息,其中背景信息可以用来判断该实体与资讯信息的相关度大小。
[0066] S202,根据背景信息确定实体和资讯信息的第一相关度。
[0067] 具体地,通过自然语言处理技术对背景信息和资讯信息进行语义识别,确定背景信息和资讯信息的内容吻合度,并将其作为实体和资讯信息的第一相关度。
[0068] S203,根据边信息,确定多个实体之间的关系强度,并根据关系强度确定多个实体之间的第二相关度。
[0069] 应当理解,同一个资讯信息包含多个实体,除了要考虑实体和资讯信息的关联度,还需要考虑多个实体之间的关联度。
[0070] 在本发明实施例所提供的事件主体的生成方法中,首先将知识图谱中的边信息与实体之间的关系相关联,再根据边信息,确定多个实体之间的关系强度。可以理解,实体之间的边信息越密集,实体之间的关系强度越强,进而可以根据关系强度确定多个实体之间的第二相关度。
[0071] S204,根据第一相关度和第二相关度,确定资讯信息对应的资讯主体。
[0072] 其中,第一相关度代表该实体与资讯信息之间的关联度,第二相关度代表该实体与其他实体之间的关联度。
[0073] 需要说明的是,资讯主体是指与资讯信息中的实体列表,且实体列表中的实体按照相对资讯信息的重要程度降序排列。
[0074] 可以理解,要评价该实体对该资讯信息的重要程度,需要综合考虑第一相关度和第二相关度,进而根据该实体的重要程度,确定资讯信息对应的资讯主体。
[0075] 一种可能的实现方式是,根据第一相关度和第二相关度,分别计算多个实体的权重得分,根据多个实体的权重得分对多个实体进行排序,以确定资讯信息对应的资讯主体。其中,权重得分可以通过对第一相关度和第二相关度加权求和获得。
[0076] 从而,实现了根据结点信息和边信息,确定资讯信息对应的资讯主体。
[0077] 为了更加清楚地说明本发明实施例所提供的事件主体的生成方法是如何通过资讯信息生成资讯主体的,下面进行举例说明。
[0078] 如图5所示,输入资讯信息之后,对资讯信息进行实体识别,然后将识别出的实体与知识图谱中的结点相关联,进而确定关联的实体在资讯信息中的重要程度,根据重要程度对识别出的实体进行排序,生成资讯主体。
[0079] 为了更加清楚地说明本发明实施例所提供的事件主体的生成方法是如何生成事件的事件主体的,本发明实施例还提出了又一种事件主体的生成方法。图6为本发明实施例所提供的又一种事件主体的生成方法的流程示意图。如图6所示,基于图1所示的方法流程,S105根据多个资讯主体,生成事件的事件主体,包括:
[0080] S301,分别获取多个资讯信息的热度和来源。
[0081] 其中,资讯信息的热度包括资讯信息的点击数、评论数、回复数,资讯信息的来源包括不同的网站。
[0082] 可以理解,不同资讯信息的热度和来源不同,而资讯信息的来源可以反映该资讯信息的可靠度,资讯信息的热度可以反映该资讯信息的影响度。
[0083] S302,根据多个资讯信息的热度和来源,分别计算多个资讯信息对应的权重值。
[0084] S303,根据资讯信息对应的权重值和多个实体的权重得分,计算多个实体对应的合并权重得分。
[0085] 可以理解,资讯主体的可靠度越高、影响度越大,该资讯信息对应的资讯主体对事件的重要程度越高,因此在将多个资讯主体合并为事件主体时,需要根据资讯信息的重要程度,对资讯主体中的实体的权重得分进行加权计算,以得到多个实体对应的合并权重得分。
[0086] S304,分别获取多个资讯主体中的多个实体,并根据合并权重得分对多个资讯主体中的多个实体进行排序,以生成事件主体。
[0087] 具体地,将多个资讯主体中的多个实体合并为一个实体列表,并按照实体对应的合并权重得分对实体进行排序,从而生成事件主体。
[0088] 从而,实现了根据多个资讯主体,生成事件的事件主体。
[0089] 为了更加清楚地说明本发明实施例所提供的事件主体的生成方法,下面进行举例说明。
[0090] 如图7所示,首先通过事件发现获得事件的多个资讯信息,对资讯信息进行实体识别,生成实体列表,对实体列表中的实体进行排序生成资讯主体。
[0091] 具体地,从知识图谱中获取实体的属性信息,对资讯信息进行别名求解、指代求解,然后确定实体的重要程度,根据实体的重要程度对实体进行排序,生成资讯信息对应的资讯主体。
[0092] 将不同资讯主体中的实体进行合并,得到事件主体对应的实体列表。计算实体对应的合并权重得分,并根据合并权重得分对事件主体对应的实体列表中的实体进行排序,生成事件的事件主体。
[0093] 为了实现上述实施例,本发明实施例还提出一种事件主体的生成装置,图8为本发明实施例所提供的一种事件主体的生成装置的结构示意图,如图8所示,该装置包括:第一获取模块410,提取模块420,第二获取模块430,确定模块440,生成模块450。
[0094] 第一获取模块410,用于获取事件的多个资讯信息。
[0095] 提取模块420,用于分别从每个资讯信息中提取出对应的多个实体。
[0096] 第二获取模块430,用于从知识图谱中获取多个实体对应的属性信息。
[0097] 确定模块440,用于根据资讯信息和多个实体对应的属性信息,确定资讯信息对应的资讯主体。
[0098] 生成模块450,用于根据多个资讯主体,生成事件的事件主体。
[0099] 进一步地,为了从知识图谱中获取多个实体对应的属性信息,一种可能的实现方式是,属性信息包括结点信息和边信息,第二获取模块430,包括:第一获取子模块431,用于获取多个实体在知识图谱中分别对应的多个结点。第二获取子模块432,用于分别获取多个结点对应的多个结点信息。第三获取子模块433,用于获取多个结点之间的边。第四获取子模块434,用于分别获取多个结点之间的边对应的边信息。
[0100] 进一步地,为了便于对资讯信息进行后续处理,一种可能的实现方式是,该装置还包括:求解模块460,用于对资讯信息进行指代求解和别名求解,以将资讯信息中的代词和别名替换为实体。
[0101] 需要说明的是,前述对事件主体的生成方法实施例的解释说明也适用于该实施例的事件主体的生成装置,此处不再赘述。
[0102] 综上所述,本发明实施例所提供的事件主体的生成装置,获取与事件相关的多个资讯信息,分别从每个资讯信息中提取出对应的多个实体。从知识图谱中获取多个实体对应的属性信息,根据资讯信息和多个实体对应的属性信息,确定资讯信息对应的资讯主体。根据多个资讯主体,生成事件的事件主体。由此,实现了充分利用知识图谱中记载的属性信息,结合资讯信息,确定资讯信息对应的资讯主体,进而生成事件的事件主体,提高了生成事件主体的准确度。
[0103] 为了实现上述实施例,本发明实施例还提出另一种事件主体的生成装置,图9为本发明实施例所提供的另一种事件主体的生成装置的结构示意图,如图9所示,基于图8所示的装置结构,确定模块440,包括:提取子模块441,第一确定子模块442,第二确定子模块443,第三确定子模块444,第四确定子模块445。
[0104] 提取子模块441,用于提取结点信息中的背景信息。
[0105] 第一确定子模块442,用于根据背景信息确定实体和资讯信息的第一相关度。
[0106] 第二确定子模块443,用于根据边信息,确定多个实体之间的关系强度。
[0107] 第三确定子模块444,用于根据关系强度确定多个实体之间的第二相关度。
[0108] 第四确定子模块445,用于根据第一相关度和第二相关度,确定资讯信息对应的资讯主体。
[0109] 进一步地,为了确定资讯信息对应的资讯主体,一种可能的实现方式是,第四确定子模块445,包括:计算单元4451,用于根据第一相关度和第二相关度,分别计算多个实体的权重得分。排序单元4452,用于根据多个实体的权重得分对多个实体进行排序,以确定资讯信息对应的资讯主体。
[0110] 需要说明的是,前述对事件主体的生成方法实施例的解释说明也适用于该实施例的事件主体的生成装置,此处不再赘述。
[0111] 从而,实现了根据结点信息和边信息,确定资讯信息对应的资讯主体。
[0112] 为了实现上述实施例,本发明实施例还提出又一种事件主体的生成装置,图10为本发明实施例所提供的又一种事件主体的生成装置的结构示意图,如图10所示,基于图8所示的装置结构,生成模块450,包括:第五获取子模块451,第一计算子模块452,第二计算子模块453,第六获取子模块454,排序子模块455。
[0113] 第五获取子模块451,用于分别获取多个资讯信息的热度和来源。
[0114] 第一计算子模块452,用于根据多个资讯信息的热度和来源,分别计算多个资讯信息对应的权重值。
[0115] 第二计算子模块453,用于根据资讯信息对应的权重值和多个实体的权重得分,计算多个实体对应的合并权重得分。
[0116] 第六获取子模块454,用于分别获取多个资讯主体中的多个实体。
[0117] 排序子模块455,用于根据合并权重得分对多个资讯主体中的多个实体进行排序,以生成事件主体。
[0118] 需要说明的是,前述对事件主体的生成方法实施例的解释说明也适用于该实施例的事件主体的生成装置,此处不再赘述。
[0119] 从而,实现了根据多个资讯主体,生成事件的事件主体。
[0120] 为了实现上述实施例,本发明实施例还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时实现如前述方法实施例所述的事件主体的生成方法。
[0121] 为了实现上述实施例,实施例还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述方法实施例所述的事件主体的生成方法。
[0122] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0123] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0124] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0125] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0126] 应当理解,本发明的各部分可以用硬件软件固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0127] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0128] 此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0129] 上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈