首页 / 专利库 / 银行与财务事项 / 市场指令 / 基于知识图谱的热点话题追溯方法及装置

基于知识图谱的热点话题追溯方法及装置

阅读:257发布:2020-05-11

专利汇可以提供基于知识图谱的热点话题追溯方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于知识图谱的热点话题追溯方法及装置,该方法包括:获取待追溯热点话题关联的一个或多个资讯事件的事件信息,其中,待追溯热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯;根据待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找待追溯热点话题关联的一个或多个历史资讯事件,其中,知识图谱中包含:各个热点话题与各个资讯事件之间的关联关系;采集待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息;输出待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。本发明能够基于待追溯热点话题关联的各个资讯事件,查找与待追溯热点话题关联的历史相似资讯事件。,下面是基于知识图谱的热点话题追溯方法及装置专利的具体信息内容。

1.一种基于知识图谱的热点话题追溯方法,其特征在于,包括:
获取待追溯热点话题关联的一个或多个资讯事件的事件信息,其中,所述待追溯热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯;
根据所述待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找所述待追溯热点话题关联的一个或多个历史资讯事件,其中,所述知识图谱中包含:各个热点话题与各个资讯事件之间的关联关系;
采集所述待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息;
输出所述待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
2.如权利要求1所述的方法,其特征在于,根据所述待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找所述待追溯热点话题关联的一个或多个历史资讯事件,包括:
根据所述待追溯热点话题关联的各个资讯事件的事件信息,从知识图谱中查找与所述待追溯热点话题关联各个资讯事件的相似度高于预设阈值的一个或多个资讯事件,并将相似度高于预设阈值的一个或多个资讯事件确定为所述待追溯热点话题关联的历史资讯事件;
根据相似度高于预设阈值的各个资讯事件的事件信息,从知识图谱中查找相似度高于预设阈值的各个资讯事件关联的热点话题,将查找到的热点话题确定为所述待追溯热点话题的相似热点话题,并将相似热点话题关联的各个资讯事件确定为所述待追溯热点话题关联的历史资讯事件。
3.如权利要求2所述的方法,其特征在于,每个资讯事件的事件信息至少包含每个资讯事件的标题和概要内容,所述方法还包括:
将所述待追溯热点话题关联各个资讯事件的标题与知识图谱中各个热点话题关联的各个资讯事件的标题进行比对,计算第一相似度;
将所述待追溯热点话题关联各个资讯事件的概要内容与知识图谱中各个热点话题关联各个资讯事件的概要内容进行比对,计算第二相似度;
根据所述第一相似度和/或第二相似度,确定知识图谱中各个资讯事件与所述待追溯热点话题关联各个资讯事件的相似度。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
根据各个资讯事件的事件信息,提取各个资讯事件的标题和概要内容。
5.如权利要求4所述的方法,其特征在于,根据各个资讯事件的事件信息,提取各个资讯事件的标题和概要内容,包括:
采集每个资讯事件关联的各个资讯的热度信息;
根据每个资讯事件关联的各个资讯的热度信息,计算每个资讯事件关联的各个资讯的热度指标;
根据最大热度指标对应的资讯,提取每个资讯事件的标题和概要内容。
6.如权利要求4所述的方法,其特征在于,根据各个资讯事件的事件信息,确定各个资讯事件的标题和概要内容,包括:
统计每个资讯事件关联的各个资讯中预设关键词的出现次数;
根据预设关键词出现最多次数的资讯,提取每个资讯事件的标题和概要内容。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
采集多个资讯平台的资讯信息;
根据多个资讯平台的资讯信息,构建一个或多个热点话题。
8.如权利要求7所述的方法,其特征在于,根据多个资讯平台的资讯信息,构建一个或多个热点话题,包括:
将多个资讯平台的资讯信息归类为一个或多个资讯话题;
实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题关联所有资讯的点击数、点赞数或评论数;
监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;
将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
9.如权利要求8所述的方法,其特征在于,所述方法还包括:
监测每个热点话题的持续时间段;
根据每个热点话题的持续时间段,确定每个热点话题对应的第二预设阈值。
10.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据各个资讯事件关联的资讯信息,统计各个资讯事件的热度信息;
根据各个资讯事件的热度信息,计算各个资讯事件的热度指标;
根据所述待追溯热点话题关联各个资讯事件的热度指标,绘制所述待追溯热点话题的热度曲线;
展示所述待追溯热点话题的热度曲线。
11.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述待追溯热点话题和所述待追溯热点话题关联的各个资讯事件,从知识图谱中查询所述待追溯热点话题关联一个或多个金融市场产品;
采集所述待追溯热点话题关联一个或多个金融市场产品的价格数据;
根据所述待追溯热点话题关联各个金融市场产品的价格数据,绘制所述待追溯热点话题关联各个金融市场产品在所述待追溯热点话题持续时间段内的价格曲线;
展示所述待追溯热点话题关联各个金融市场产品的价格曲线。
12.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据每个资讯事件的事件信息,从知识图谱中查找每个资讯事件关联的一个或多个金融市场产品;
采集每个资讯事件关联各个金融市场产品的价格数据;
根据每个资讯事件关联各个金融市场产品的价格数据,计算每个资讯事件对各个金融市场产品价格变化影响的价格波动率;
输出各个资讯事件对各个金融市场产品价格变化影响的价格波动率。
13.如权利要求12所述的方法,其特征在于,根据每个资讯事件关联各个金融市场产品的价格数据,计算每个资讯事件对各个金融市场产品价格变化影响的价格波动率,包括:
获取每个资讯事件对应的第一时间戳和第二时间戳,其中,所述第一时间戳为每个资讯事件发生时刻之前的一个时刻,所述第二时间戳为每个资讯事件发生时刻之后的一个时刻;
根据每个资讯事件对应的第一时间戳和所述金融市场产品产生价格数据的价格时间段,确定所述金融市场产品在每个资讯事件发生之前的第一价格;
根据每个资讯事件对应的第二时间戳和所述金融市场产品产生价格数据的价格时间段,确定所述金融市场产品在每个资讯事件发生之后的第二价格;
根据所述第一价格和所述第二价格,确定每个资讯事件对所述金融市场产品价格变化影响的价格波动率。
14.如权利要求13所述的方法,其特征在于,根据每个资讯事件对应的第一时间戳和所述金融市场产品产生价格数据的价格时间段,确定所述金融市场产品在每个资讯事件发生之前的第一价格,包括:
判断第一时间戳是否落入所述金融市场产品产生价格数据的价格时间段内;
如果所述第一时间戳落入所述金融市场产品产生价格数据的价格时间段内,则将所述金融市场产品产生价格数据的价格时间段内所述第一时间戳到每个资讯事件发生时刻之间金融市场产品的平均价格或所述第一时间戳对应金融市场产品的价格,确定为所述金融市场产品在每个资讯事件发生之前的第一价格;
如果所述第一时间戳未落入所述金融市场产品产生价格数据对应的时间段内,则将所述第一时间戳之前且与所述第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为所述金融市场产品在每个资讯事件发生之前的第一价格。
15.如权利要求13所述的方法,其特征在于,根据每个资讯事件对应的第二时间戳和所述金融市场产品产生价格数据的价格时间段,确定所述金融市场产品在每个资讯事件发生之后的第二价格,包括:
判断第二时间戳是否落入所述金融市场产品产生价格数据的价格时间段内;
如果所述第二时间戳落入所述金融市场产品产生价格数据的价格时间段内,则将所述金融市场产品产生价格数据的价格时间段内每个资讯事件发生时刻到所述第二时间戳之间金融市场产品的平均价格或所述第二时间戳对应金融市场产品的价格,确定为所述金融市场产品在每个资讯事件发生之后的第二价格;
如果所述第二时间戳未落入所述金融市场产品产生价格数据对应的时间段内,则将在所述第二时间戳之后且与所述第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为所述金融市场产品在每个资讯事件发生之后的第二价格。
16.如权利要求1至15任一项所述的方法,其特征在于,所述方法还包括:
获取用户关注的一个或多个金融市场产品的产品信息;
根据各个金融市场产品的产品信息,从知识图谱中查找与各个金融市场产品关联的一个或多个热点话题;
在界面上展示与每个金融市场产品关联的各个热点话题;
接收话题选择指令,其中,所述话题选择指令用于选择任意一个热点话题作为所述待追溯热点话题;
通过可视化图表展示所述待追溯热点话题的日志信息,其中,所述日志信息中至少包括:所述待追溯热点话题关联的各个资讯事件的标题、概要内容和热度信息,每个资讯事件的热度信息包含每个资讯事件关联的一个或多个资讯的点击数、点赞数或评论数。
17.一种基于知识图谱的热点话题追溯装置,其特征在于,包括:
热点话题信息查询模,用于获取待追溯热点话题关联的一个或多个资讯事件的事件信息,其中,所述待追溯热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯;
知识图谱查找模块,用于根据所述待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找所述待追溯热点话题关联的一个或多个历史资讯事件;
热点话题资讯信息采集模块,用于采集所述待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息;
热点话题资讯信息输出模块,用于输出所述待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
18.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至16任一项所述基于知识图谱的热点话题追溯方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至16任一项所述基于知识图谱的热点话题追溯方法的计算机程序。

说明书全文

基于知识图谱的热点话题追溯方法及装置

技术领域

[0001] 本发明涉及互联网领域,尤其涉及一种基于知识图谱的热点话题追溯方法及装置。

背景技术

[0002] 本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术
[0003] 随着互联网的快速发展,用户能够通过互联网获取的资讯信息量呈现爆发式增长,为了提高资讯内容的阅读效率,快速提取到有效信息,可以根据某一时间段内的资讯信息构建一个或多个热点话题,使得用户能够快速追溯其关注的热点话题关联的资讯信息。然而,随着历史热点话题资讯数据的积累,对于某个热点话题,除了构建热点话题时直接关联到该热点话题的一个或多个资讯事件的资讯信息,历史积累资讯数据中可能有一些资讯事件是与该热点话题相关的,但是由于其发生时间较早,已经被关联到历史热点话题中,因而,急需一种能够查找与待追溯热点话题关联的历史相似资讯事件,以便追溯到更全面地资讯信息。
[0004] 目前,现有资讯平台通过搜索关键词的方式,来实现对历史资讯信息进行追溯,通过这种方式搜出的资讯信息是海量的,无法快速追溯到某个热点话题的资讯热度趋势,且由于这种方式仅能够搜索出包含搜索关键词的资讯内容,导致一些没有包含搜索关键词但与热点话题相关的资讯内容没有被搜索到,使得对某个热点话题追溯到的资讯信息不够全面。
[0005] 针对上述问题,目前尚未提出有效的解决方案。

发明内容

[0006] 本发明实施例提供一种基于知识图谱的热点话题追溯方法,用以解决现有资讯平台通过搜索关键词的方式,来实现对历史资讯信息进行追溯,导致对某个热点话题的资讯信息追溯效率低,信息不全面的技术问题,该方法包括:获取待追溯热点话题关联的一个或多个资讯事件的事件信息,其中,待追溯热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯;根据待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找待追溯热点话题关联的一个或多个历史资讯事件,其中,知识图谱中包含:各个热点话题与各个资讯事件之间的关联关系;采集待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息;输出待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0007] 本发明实施例还提供一种基于知识图谱的热点话题追溯装置,用以解决现有资讯平台通过搜索关键词的方式,来实现对历史资讯信息进行追溯,导致对某个热点话题的资讯信息追溯效率低,信息不全面的技术问题,该装置包括:热点话题信息查询模,用于获取待追溯热点话题关联的一个或多个资讯事件的事件信息,其中,待追溯热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯;知识图谱查找模块,用于根据待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找待追溯热点话题关联的一个或多个历史资讯事件,其中,知识图谱中包含:各个热点话题与各个资讯事件之间的关联关系;热点话题资讯信息采集模块,用于采集待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息;热点话题资讯信息输出模块,用于输出待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0008] 本发明实施例还提供一种计算机设备,用以解决现有资讯平台通过搜索关键词的方式,来实现对历史资讯信息进行追溯,导致对某个热点话题的资讯信息追溯效率低,信息不全面的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于知识图谱的热点话题追溯方法。
[0009] 本发明实施例还提供一种计算机可读存储介质,用以解决现有资讯平台通过搜索关键词的方式,来实现对历史资讯信息进行追溯,导致对某个热点话题的资讯信息追溯效率低,信息不全面的技术问题,该计算机可读存储介质存储有执行上述基于知识图谱的热点话题追溯方法的计算机程序。
[0010] 本发明实施例中,在获取到待追溯热点话题关联的一个或多个资讯事件的事件信息后,根据待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找待追溯热点话题关联的一个或多个历史资讯事件,采集待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息,并输出待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0011] 通过本发明实施例,基于待追溯热点话题关联的各个资讯事件,查找与待追溯热点话题关联的历史相似资讯事件,不仅能够大大提高对历史资讯进行追溯的效率,而且能够更加全面地展示待追溯热点话题的资讯信息。附图说明
[0012] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0013] 图1为本发明实施例中提供的一种基于知识图谱的热点话题追溯方法流程图
[0014] 图2为本发明实施例中提供的一种知识图谱示意图;
[0015] 图3为本发明实施例中提供的一种可选的热点话题追溯界面示意图;
[0016] 图4为本发明实施例中提供的一种优选的热点话题追溯界面示意图;
[0017] 图5为本发明实施例中提供的一种资讯事件对应的第一时间戳和第二时间戳均落入产品价格时间段内的示意图;
[0018] 图6为本发明实施例中提供的一种资讯事件对应的第一时间戳和第二时间戳均未落入产品价格时间段内的示意图;
[0019] 图7为本发明实施例中提供的一种资讯事件对应的第一时间戳落入产品价格时间段内而第二时间戳未落入产品价格时间段内的示意图;
[0020] 图8为本发明实施例中提供的一种资讯事件对应的第一时间戳未落入产品价格时间段内而第二时间戳落入产品价格时间段内的示意图;
[0021] 图9为本发明实施例中提供的一种基于知识图谱的热点话题追溯装置。

具体实施方式

[0022] 为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
[0023] 在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
[0024] 本发明实施例中提供了一种基于知识图谱的热点话题追溯方法,图1为本发明实施例中提供的一种基于知识图谱的热点话题追溯方法流程图,如图1所示,该方法可以包括如下步骤:
[0025] S101,获取待追溯热点话题关联的一个或多个资讯事件的事件信息,其中,待追溯热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯。
[0026] 需要说明的是,本发明实施例中待追溯热点话题可以是一个新构建的热点话题,也可以是任意一个历史热点话题。
[0027] 在上述S101之前,本发明实施例提供的热点话题日志信息的展示方法还可以通过如下步骤来实现各个热点话题的构建:采集多个资讯平台的资讯信息;将资讯信息归类为一个或多个资讯话题;实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题内所有资讯的点击数、点赞数或评论数;监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
[0028] 本发明实施例通过对不同资讯平台的资讯信息进行归类,从海量资讯信息中提取热点话题,并记录热点话题的资讯信息,能够提高用户阅读资讯内容的效率,让用户快速了解到其关注的资讯话题的影响趋势,对于金融市场茶品的投资用户,能够快速从海量的财经新闻资讯中了解其已投资或意向投资的金融市场产品受政策、市场的影响情况。
[0029] 由于不同的热点话题,热度变化的持续时间存在较大差异,有的热点话题可能持续一天或几天,有的热点话题可能持续几个月,甚至一年或几年,因而,在构建各个热点话题的时候,确定各个热点话题是否结束的热度指标阈值(即第二预设阈值)也需要设定不同的值,作为一种可选的实施方式,本发明实施例可以通过如下步骤来确定各个热点话题结束的热度指标阈值:监测每个热点话题的持续时间段;根据每个热点话题的持续时间段,确定每个热点话题对应的第二预设阈值。
[0030] 本发明实施例中资讯平台可以是任意一种发布资讯的平台,包括但不限于微博、微信朋友圈、网易新闻等;作为一种优选的实施例,本发明实施例以发布金融市场产品相关资讯为例来进行说明,例如,彭博社、Wind、华尔街见闻等资讯平台每天会推送大量财经新闻资讯,用户通常阅读这些财经新闻资讯,以对其已经投资的金融市场产进行趋势预判。
[0031] 作为一种可选的实施方式,本发明实施例可以通过统一的资讯接口,与各个资讯平台进行对接,以采集各个资讯平台上发布的资讯信息。现有技术中,用户通过不同的资讯平台来查看新闻资讯,不仅耗时耗力,而且对于同一话题,可能不同的资讯平台上均会发布资讯,导致用户重复查看资讯会浪费很多时间。本发明实施例通过统一的资讯接口,与多个资讯平台对接,不仅可以提供更全面的资讯内容,而且还可以起到去冗余的作用。
[0032] 在将资讯信息归类为一个或多个热点话题的时候,可以采用各种聚类算法将来自各个资讯平台的资讯信息归类为不同的热点话题,现有的聚类方法有很多,本发明实施例对此不再赘述。
[0033] 由于热点话题关联至少一个资讯事件,关联多条资讯(例如,当出现某个事件后,不同资讯平台都会发布一条或多条资讯来报道某个事件),每条资讯都有相应的点击数、点赞数或评论数等影响热度变化的影响力指标,因而,通过采集每个资讯事件关联的所有资讯的点击数、点赞数或评论数等影响力指标,并针对不同的影响力指标设定不同的权重,进行加权平均,即可计算得到每个资讯事件的热度指标。需要注意的是,每条资讯的影响力指标是实时变化的,因而,每个资讯事件的热度指标也是实时变化的。
[0034] 本发明实施例将热度指标在一段时间内持续高于某个阈值的资讯话题确定为热点话题。通过实时监测每个资讯话题内各条资讯的热度信息,能够实时计算每个资讯话题的热度指标,因而,可以通过实时监测各个资讯话题的热度指标是否在一预设时间段内均持续高于某个阈值(即第一预设阈值)。通常,如果一个热点话题的热度指标仅在某个时刻高于预设阈值,其他时刻均低于预设阈值,则表明该热点话题的影响力不大,因而不能将其能确定为热点话题。
[0035] 可选地,本发明实施例中确定一个热点话题开始的第一预设时间段和热度指标的第一预设阈值,均可以针对不同的应用场景具体设定,本发明实施例对此不作限定。例如,一种实施方式中,同一热点话题,对于不同的资讯来源(即不同的资讯平台),可以设定不同的热度指标阈值和权重,将各个资讯平台的热度指标阈值加权平均,得到热点话题的热度指标阈值;另一种实施方式中,可以对历史多个热点话题的多个热度指标阈值求平均,将均值确定为当前热点话题的热度指标阈值。
[0036] S102,根据待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找待追溯热点话题关联的一个或多个历史资讯事件,其中,知识图谱中包含:各个热点话题与各个资讯事件之间的关联关系。
[0037] 需要说明的是,本发明实施例可以预先根据用户信息、金融市场产品的产品信息、热点话题的话题信息以及各个热点话题关联的资讯事件的事件,构建知识图谱,图2为本发明实施例中提供的一种知识图谱示意图,如图2所示,该知识图谱中,实体包括:“用户”、“产品”、“资讯事件”、“热点话题”;其中,“用户”与“产品”之间具有关注关系;“用户”与“资讯事件”之间具有关注关系;“用户”与“热点话题”之间具有关注关系;“产品”与“资讯事件”之间具有关联关系;“产品”与“热点话题”之间具有关联关系;“资讯事件”与“热点话题”之间具有关联关系。
[0038] 作为一种可选的实施方式,上述S102可以通过如下步骤来实现:根据待追溯热点话题关联的各个资讯事件的事件信息,从知识图谱中查找与待追溯热点话题关联各个资讯事件的相似度高于预设阈值的一个或多个资讯事件,并将相似度高于预设阈值的一个或多个资讯事件确定为待追溯热点话题关联的历史资讯事件;根据相似度高于预设阈值的各个资讯事件的事件信息,从知识图谱中查找相似度高于预设阈值的各个资讯事件关联的热点话题,将查找到的热点话题确定为待追溯热点话题的相似热点话题,并将相似热点话题关联的各个资讯事件确定为待追溯热点话题关联的历史资讯事件。
[0039] 其中,每个资讯事件的事件信息至少包含每个资讯事件的标题和概要内容,因而,在确定待追溯热点话题关联的各个资讯事件与历史资讯事件的相似度的时候,可以通过如下步骤来实现:将待追溯热点话题关联各个资讯事件的标题与知识图谱中各个热点话题关联的各个资讯事件的标题进行比对,计算第一相似度;将待追溯热点话题关联各个资讯事件的概要内容与知识图谱中各个热点话题关联各个资讯事件的概要内容进行比对,计算第二相似度;根据第一相似度和/或第二相似度,确定知识图谱中各个资讯事件与待追溯热点话题关联各个资讯事件的相似度。
[0040] 本发明实施例可以根据各个资讯事件的事件信息,提取各个资讯事件的标题和概要内容,具体可以通过如下两种实施方式来实现:
[0041] 第一种可选的实施方式中,采集每个资讯事件关联的各个资讯的热度信息;根据每个资讯事件关联的各个资讯的热度信息,计算每个资讯事件关联的各个资讯的热度指标;根据最大热度指标对应的资讯,提取每个资讯事件的标题和概要内容。
[0042] 第二种可选的实施方式中,统计每个资讯事件关联的各个资讯中预设关键词的出现次数;根据预设关键词出现最多次数的资讯,提取每个资讯事件的标题和概要内容。
[0043] 需要注意的是,在根据某条资讯的资讯内容提取资讯事件的标题和概要内容的时候,可以直接将该条资讯的资讯标题作为资讯事件的标题,另外,对该条资讯的资讯内容进行自然语言分析(分段、分句、分词、词性标注等)后,基于语料库,删除资讯详情内容中的动词、代词、定语、状语等修饰词,仅保留名词,得到第一文本内容,将第一文本内容作为资讯事件的的概要内容;如果第一文本内容的字数超过预设字数(例如,160字数),则仅保留第一文本内容中第一段和最后一段的内容,得到第二文本内容,将第二文本内容作为资讯事件的的概要内容。
[0044] 优选地,由于新闻资讯的特殊性,新闻资讯中通常都会包含人物、地点和事件,因而,本发明实施例可以基于预先构建的姓名信息库和地名信息库,提取每条资讯中包含的人物姓名和地点名称等名词,以确定每个资讯事件的标题和概要内容,能够提高信息提取的准确性。通常。每条资讯中出现次数最多人名或地名即为资讯事件的人物和地点。
[0045] 可选地,在提取每条资讯包含的人名或地名等名词,并去重后,可以直接将所有提取词作为每个资讯事件的标题,或将包含所有提取词的句子作为每个资讯事件的标题,或从包含所有提取词的句子中提取出的关键信息,作为每个资讯事件的标题;另外,将包含提取词个数最多的段落作为每个资讯事件的概要内容,或将标题句所在段落作为每个资讯事件的概要内容,或根据提取词生成相应的概要内容。
[0046] S103,采集待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0047] 需要说明的是,在基于知识谱图,根据待追溯热点话题关联的各个资讯事件的事件信息,查找到待追溯热点话题关联的一个或多个历史资讯事件后,可以采集该待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0048] S104,输出待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0049] 需要注意的是,本发明实施例提供的热点话题追溯方法还可以包括如下步骤:采集多个资讯平台的资讯信息;根据多个资讯平台的资讯信息,构建一个或多个热点话题。
[0050] 其中,在根据多个资讯平台的资讯信息,构建一个或多个热点话题的时候,可以通过如下步骤来实现:将多个资讯平台的资讯信息归类为一个或多个资讯话题;实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题关联所有资讯的点击数、点赞数或评论数;监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
[0051] 需要说明的是,每个热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯,每个资讯都有其相应的点击数、点赞数或评论数等能够表征其热度信息的影响力指标,因而,在获取到某个热点话题关联的各个资讯事件的资讯信息后,可以统计该热点话题内各个资讯事件的热度信息,也即各个资讯事件分别关联的资讯的点击数、点赞数或评论数。
[0052] 可选地,本发明实施例提供的热点话题追溯方法还可以包括如下步骤:监测每个热点话题的持续时间段;根据每个热点话题的持续时间段,确定每个热点话题对应的第二预设阈值。
[0053] 本发明实施例提供的热点话题追溯方法还可以包括如下步骤:根据各个资讯事件关联的资讯信息,统计各个资讯事件的热度信息;根据各个资讯事件的热度信息,计算各个资讯事件的热度指标;根据待追溯热点话题关联各个资讯事件的热度指标,绘制待追溯热点话题的热度曲线;展示待追溯热点话题的热度曲线。
[0054] 为了便于金融市场产品的投资用户了解其已投资或意向投资的金融市场产品受热点话题资讯事件影响的价格变化,因而,本发明实施例根据各个金融市场产品的价格数据绘制相应的价格曲线,也输出到热点话题的展示界面上,可以将其与热点话题的热度曲线进行比对,让金融市场产品的投资用户清晰地了解热点话题对金融市场产品价格变化的影响。
[0055] 因而,在一种可选的实施例中,本发明实施例提供的热点话题追溯方法还可以包括如下步骤:根据待追溯热点话题和待追溯热点话题关联的各个资讯事件,从知识图谱中查询待追溯热点话题关联一个或多个金融市场产品;采集待追溯热点话题关联一个或多个金融市场产品的价格数据;根据待追溯热点话题关联各个金融市场产品的价格数据,绘制待追溯热点话题关联各个金融市场产品在待追溯热点话题持续时间段内的价格曲线;展示待追溯热点话题关联各个金融市场产品的价格曲线。
[0056] 优选地,界面上可以展示多个金融市场产品,本发明实施例提供的热点话题日志信息展示方法还可以包括如下步骤:接收第二选择指令,其中,所述第二选择指令用于选择在所述热点话题展示界面上显示的一个或多个金融市场产品;在所述热点话题展示界面上,显示所述第二选择指令选择的一个或多个金融市场产品的价格曲线。
[0057] 进一步地,为了为了量化热点话题中各个资讯事件对金融市场产品价格变化的影响,让用户更加直观了解资讯事件对其关注的金融市场产品价格波的影响,在一种可选的实施例中,本发明实施例提供的热点话题追溯方法还可以包括如下步骤:根据每个资讯事件的事件信息,从知识图谱中查找每个资讯事件关联的一个或多个金融市场产品;采集每个资讯事件关联各个金融市场产品的价格数据;根据每个资讯事件关联各个金融市场产品的价格数据,计算每个资讯事件对各个金融市场产品价格变化影响的价格波动率;输出各个资讯事件对各个金融市场产品价格变化影响的价格波动率。
[0058] 图3为本发明实施例中提供的一种可选的热点话题日志信息的展示界面示意图,如图3所示,让金融市场产品的投资用户快速了解到热点话题影响力趋势,以及热点话题对金融市场产品价格变化的影响情况。当用户选择其关注的一个或多个金融市场产品后,将用户选择的金融市场产品的价格曲线与该热点话题的热度曲线进行对比显示。
[0059] 对于图2所示的知识图谱,当“用户1”选择“产品1”后,可以显示与对该“产品1”价格影响的“热点话题A”,在“热点话题A”的展示界面上,可以展示“热点话题A”直接关联的“资讯事件1”、“资讯事件2”、“资讯事件3”。基于知识图谱,可以找到“资讯事件3”还与“热点话题B”关联(也即“热点话题B”有一个与“热点话题A”的“资讯事件3”的相似度为100%的资讯事件),表明“热点话题B”是与“热点话题A”相关的一个历史热点话题,从而将“热点话题B”关联的“资讯事件6”作为“热点话题A”关联的历史相似资讯事件。
[0060] 另外,根据事件相似度,查找到知识图谱上的“资讯事件6”与“热点话题A”的“资讯事件6”具有关联关系,可以表明“热点话题D”也是与“热点话题A”相关的一个历史热点话题;因而可以,将“资讯事件6”作为“热点话题A”关联的历史相似资讯事件。
[0061] 进一步地,根据话题相似度(可以直接比对两个热点话题标题或概要内容,计算话题相似度,也可以根据两个热点话题中的资讯事件的事件相似度,加权平均,得到两个热点话题的话题相似度),可以查找到知识图谱上“热点话题C”是与“热点话题A”相关的一个历史热点话题,因而,“热点话题C”的“资讯事件7”也是“热点话题A”关联的一个历史相似资讯事件。
[0062] 如图3所示,界面上展示的“产品1”、“产品2”、“产品3”等产品可以是根据用户历史浏览资讯信息或热点话题推送的金融市场产品,界面上展示的“热点话题A”(“热点话题A”与“产品1”直接关联)、“热点话题B”(“热点话题B”与“热点话题A”关联同一个资讯事件)、“热点话题C”(“热点话题C”与“热点话题A”具有一定的话题相似度)、“热点话题D”(“热点话题D”的“资讯事件6”与“热点话题A”的资讯事件具有一定话题相似度)等热点话题可以与用户选择金融市场产品(例如,“产品1”)相关的热点话题;当用户选择某个热点话题(例如,“热点话题A”),可以按照时间轴展示该热点话题的日志信息,滚动或滑动时间轴,可以查看该热点话题整个生命周期内关联的各个资讯事件的资讯信息。
[0063] 可选地,针对每个资讯事件,可以展示每个资讯事件的标题(例如,“资讯事件1”“资讯事件2”、“资讯事件3”)、资讯信息概要内容,该资讯事件的浏览量、评论量、转发量、资讯来源平台(如果为多个,可以点击“来源”控件查看各个资讯平台)、热度指标值(该资讯事件关联所有资讯热度信息的加权求和值)和对金融市场产品(例如,产品1)价格影响的价格波动率。针对某个热点话题关联的各个资讯事件,可以按照时间排序或按热度排序。可选地,也可以按照各个资讯事件的其他指标(价格波动率、转发量等)进行排序。
[0064] 对于“热点话题A”的历史相似资讯事件,由于界面上的空间有限,可以按照一定的优先级(与“热点话题A”的关联程度)展示“热点话题A”关联的各个历史相似资讯事件,例如,图3所示的“资讯事件4”和“资讯事件6”。
[0065] 图4为本发明实施例中提供的一种优选的热点话题日志信息的展示界面示意图,如图4所示,对于历史相似资讯事件的展示,也可以展示各个资讯事件的标题、资讯信息概要内容,该资讯事件的浏览量、评论量、转发量、资讯来源平台(如果为多个,可以点击“来源”控件查看各个资讯平台)、热度指标值(该资讯事件关联所有资讯热度信息的加权求和值)和对金融市场产品(例如,产品1)价格影响的价格波动率。
[0066] 可选地,如图3和图4所示,在展示每个热点话题的时候,还可以在界面上展示一些专家用户对每个热点的评述内容(例如,资讯热度发展趋势、对金融市场产品的价格影响趋势等),以便普通用户快速了解某个热点话题。
[0067] 需要注意的是,界面上方的热点曲线与界面下方展示的资讯信息是保持一致的,滚动界面下方的时间轴,界面上方的热点曲线随之改变;移动界面上方展示的热度曲线,界面下方的资讯信息也随之改变。
[0068] 本发明实施例在显示某个热点话题的热度曲线和相关金融市场产品价格曲线的同时,将该热点话题内各个资讯事件对金融市场产品价格变化影响的价格波动率显示在热点话题展示界面上,使得用户不仅可以快速查看各个热点话题内各个资讯事件的资讯信息,还可以直观了解到各个资讯事件对其关注的金融市场产品的价格波动影响。
[0069] 作为一种可选的实施方式,本发明实施例在根据每个资讯事件关联各个金融市场产品的价格数据,计算每个资讯事件对各个金融市场产品价格变化影响的价格波动率,可以具体通过如下步骤来实现:获取每个资讯事件对应的第一时间戳和第二时间戳,其中,第一时间戳为每个资讯事件发生时刻之前的一个时刻,第二时间戳为每个资讯事件发生时刻之后的一个时刻;根据每个资讯事件对应的第一时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个资讯事件发生之前的第一价格;根据每个资讯事件对应的第二时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个资讯事件发生之后的第二价格;根据第一价格和第二价格,确定每个资讯事件对金融市场产品价格变化影响的价格波动率。
[0070] 可选地,可以通过如下步骤来确定金融市场产品在每个资讯事件发生之前的第一价格:判断第一时间戳是否落入金融市场产品产生价格数据的价格时间段内;如果第一时间戳落入金融市场产品产生价格数据的价格时间段内,则将金融市场产品产生价格数据的价格时间段内第一时间戳到每个资讯事件发生时刻之间金融市场产品的平均价格或第一时间戳对应金融市场产品的价格,确定为金融市场产品在每个资讯事件发生之前的第一价格;如果第一时间戳未落入金融市场产品产生价格数据对应的时间段内,则将第一时间戳之前且与第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为金融市场产品在每个资讯事件发生之前的第一价格。
[0071] 可选地,可以通过如下步骤来确定金融市场产品在每个资讯事件发生之后的第二价格:判断第二时间戳是否落入金融市场产品产生价格数据的价格时间段内;如果第二时间戳落入金融市场产品产生价格数据的价格时间段内,则将金融市场产品产生价格数据的价格时间段内每个资讯事件发生时刻到第二时间戳之间金融市场产品的平均价格或第二时间戳对应金融市场产品的价格,确定为金融市场产品在每个资讯事件发生之后的第二价格;如果第二时间戳未落入金融市场产品产生价格数据对应的时间段内,则将在第二时间戳之后且与第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为金融市场产品在每个资讯事件发生之后的第二价格。
[0072] 由于每个热点话题通常包含多个资讯事件,在确定热点话题内每个资讯事件对各个金融市场产品价格变化影响的价格波动率之后,作为一种优选的实施方式,还可以根据热点话题内各个资讯事件对各个金融市场产品价格变化影响的价格波动率,确定热点话题对各个金融市场产品价格变化影响的价格波动率。
[0073] 本发明实施例中,假设某个资讯事件对应的第一时间戳和第二时间戳分别为Δt1和Δt1,下面结合图5~图8来对第一价格和第二价格的确定具体说明:
[0074] 如图5或图7所示,第一时间戳Δt1落入了金融市场产品产生价格数据的价格时间段(即第一价格时间段t1~t2)内,则将金融市场产品产生价格数据的价格时间段内第一时间戳到每个资讯事件发生时刻之间金融市场产品的平均价格或第一时间戳对应金融市场产品的价格,确定为金融市场产品在每个资讯事件发生之前的第一价格;如图6或图8所示,第一时间戳Δt1未落入金融市场产品产生价格数据对应的时间段内,则将第一时间戳之前且与第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为金融市场产品在每个资讯事件发生之前的第一价格。
[0075] 如图5或图8所示,第二时间戳Δt2落入金融市场产品产生价格数据的价格时间段(图5中第二时间戳Δt2落入第一价格时间段t1~t2,图8中第二时间戳Δt2落入第二价格时间段t3~t4)内,则将金融市场产品产生价格数据的价格时间段内每个资讯事件发生时刻到第二时间戳之间金融市场产品的平均价格或第二时间戳对应金融市场产品的价格,确定为金融市场产品在每个资讯事件发生之后的第二价格;如图6或图7所示,第二时间戳Δt2未落入金融市场产品产生价格数据对应的时间段内,则将在第二时间戳之后且与第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为金融市场产品在每个资讯事件发生之后的第二价格。
[0076] 需要注意的是,图6中第一时间戳Δt1和第二时间戳Δt2均未落入金融市场产品产生价格数据的价格时间段内,因而,将第一时间戳之前且与第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为金融市场产品在每个资讯事件发生之前的第一价格;且将在第二时间戳之后且与第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为金融市场产品在每个资讯事件发生之后的第二价格。
[0077] 例如,某个资讯事件A发生前后,产品a的第一价格和第二价格分别为P1和P2,则该资讯事件A对该产品a影响的价格波动率表示为:
[0078]
[0079] 其中,ΔP表示资讯事件A对该产品a影响的价格波动率。
[0080] 在一种可选的实施例中,本发明实施例提供的热点话题追溯方法还可以包括如下步骤:获取用户关注的一个或多个金融市场产品的产品信息;根据各个金融市场产品的产品信息,从知识图谱中查找与各个金融市场产品关联的一个或多个热点话题;在界面上展示与每个金融市场产品关联的各个热点话题;接收话题选择指令,其中,话题选择指令用于选择任意一个热点话题作为待追溯热点话题;通过可视化图表展示待追溯热点话题的日志信息,其中,日志信息中至少包括:待追溯热点话题关联的各个资讯事件的标题、概要内容和热度信息,每个资讯事件的热度信息包含每个资讯事件关联的一个或多个资讯的点击数、点赞数或评论数。
[0081] 本发明实施例通过展示可视化图表展示每个热点话题的日志信息,能够直观展示一个热点话题生命周期内相关资讯事件的资讯信息,帮助用户快速追溯某个热点话题关联的所有资讯事件,了解该热点话题的影响力趋势,提高对资讯信息的阅读效率。
[0082] 需要说明的是,每个资讯事件的热度信息包括但不下限于每个资讯事件关联的所有资讯的点击总数、点赞总数或评论总数;需要注意的是,在生成点话题的日志信息的时候,除了上述各个资讯事件的标题、概要内容和热度信息外,还可以结合各个资讯事件的其他信息,例如,每个资讯事件包含资讯信息的资讯来源,每个资讯事件对一个或多个金融市场产品价格影响的价格波动率等。
[0083] 由于各个热点话题的热度指标都是随着时间不断变化的,为了让用户直观了解各个热点话题的热度变化趋势,可以根据各个热点话题在持续时间段内的热度指标,绘制各个热点话题在持续时间段内的热度曲线,并输出到热点话题的展示界面上。因而,在统计各个资讯事件的热度信息之后,作为一种可选的实施例,本发明实施例提供的热点话题日志信息展示方法还可以包括如下步骤:根据各个资讯事件的热度信息,计算各个资讯事件的热度指标;根据热点话题内各个资讯事件的热度指标,绘制热点话题内各个资讯事件在热点话题持续时间段内的热度曲线;在界面上展示热点话题内各个资讯事件在热点话题持续时间段内的热度曲线。
[0084] 优选地,界面上可以展示多个热点话题,本发明实施例提供的热点话题日志信息展示方法还可以包括如下步骤:接收第一选择指令,其中,第一选择指令用于选择在热点话题展示界面上显示的一个或多个热点话题;在热点话题展示界面上,显示第一选择指令选择的一个或多个热点话题的热度曲线。当用户选择某个热点话题后,可以在界面上展示该热点话题的热度曲线,优选地,还可以标记热度曲线的极值点,进而显示热点事件的资讯信息。
[0085] 在确定每个热点话题的热度曲线后,作为一种可选的实施方式,本发明实施例提供的热点话题日志信息展示方法还可以包括如下步骤:获取热度曲线上的一个或多个极值点,并在热度曲线的各个极值点上,显示各个极值点对应的资讯信息,其中,每个极值点对应的资讯信息为一个热点事件的资讯信息。通过该实施方式,能够展示一个热点话题生周期的高潮点或低潮点,并展示高潮点或低潮点对应的热点事件的资讯信息。
[0086] 在确定热度曲线极值点的时候,可以通过如下步骤来实现:将热度曲线上的各个极大值点连接,形成热度曲线的上包络线;将热度曲线上的各个极小值点连接,形成热度曲线的下包络线;对上包络线和下包络线上每个时刻对应的值求平均值,得到热度曲线的均线;根据热度曲线的上包络线、下包络线或均线,确定热度曲线上的一个或多个极值点。
[0087] 可选地,可以将上包络线或下包络线的极大值点作为热度曲线的极大值点,将上包络线或下包络线的极小值点作为热度曲线的极小值点。由于上包络线的值通常大于下包络线,优选地,可以将上包络线的极大值点作为热度曲线的极大值点,将下包络线的极小值点作为热度曲线的极小值点。为了进一步提高准确率,可以将均线的极大值点作为热度曲线的极大值点,将均线的极小值点作为热度曲线的极小值点。
[0088] 另外,还需要说明的是,如果将热度曲线上的各个极值点(极大值点或极小值点)连接,形成的包络线不平滑,对形成的包络线进行曲线拟合处理,直到形成平滑的上包络线和下包络线。
[0089] 进一步地,本发明实施例在将热点话题与各个金融市场产品关联后,可以根据用户关注的热点话题,向用户推送一些相关金融市场产品的产品信息,或者根据用户已经投资的金融市场产品,向用户推送一些相关的热点话题资讯。可选地,在推送的产品信息或资讯信息可以加入产品购买链接,以便在用户想要购买某个金融市场产品的同时,能够快速进入相应的购买界面。
[0090] 由上可知,本发明实施例提供的基于知识图谱的热点话题追溯方法,在获取到待追溯热点话题关联的一个或多个资讯事件的事件信息后,根据待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找待追溯热点话题关联的一个或多个历史资讯事件,采集待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息,并输出待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0091] 通过本发明实施例提供的基于知识图谱的热点话题追溯方法,基于待追溯热点话题关联的各个资讯事件,查找与待追溯热点话题关联的历史相似资讯事件,不仅能够大大提高对历史资讯进行追溯的效率,而且能够更加全面地展示待追溯热点话题的资讯信息。
[0092] 基于同一发明构思,本发明实施例中还提供了一种基于知识图谱的热点话题追溯装置,如下面的实施例所述。由于该装置实施例解决问题的原理与基于知识图谱的热点话题追溯方法相似,因此该装置实施例的实施可以参见方法的实施,重复之处不再赘述。
[0093] 图9为本发明实施例中提供的一种基于知识图谱的热点话题追溯装置,如图9所示,该装置可以包括:热点话题信息查询模块901、知识图谱查找模块902、热点话题资讯信息采集模块903和热点话题资讯信息输出模块904。
[0094] 其中,热点话题信息查询模块901,用于获取待追溯热点话题关联的一个或多个资讯事件的事件信息,其中,待追溯热点话题关联一个或多个资讯事件,每个资讯事件关联一个或多个资讯;知识图谱查找模块902,用于根据待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找待追溯热点话题关联的一个或多个历史资讯事件,其中,知识图谱中包含:各个热点话题与各个资讯事件之间的关联关系;热点话题资讯信息采集模块903,用于采集待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息;热点话题资讯信息输出模块904,用于输出待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0095] 由上可知,本发明实施例提供的基于知识图谱的热点话题追溯装置,通过热点话题信息查询模块901查询待追溯热点话题关联的一个或多个资讯事件的事件信息;通过知识图谱查找模块902根据待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找待追溯热点话题关联的一个或多个历史资讯事件;通过热点话题资讯信息采集模块903采集待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息,并通过热点话题资讯信息输出模块904输出待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0096] 通过本发明实施例提供的基于知识图谱的热点话题追溯装置,基于待追溯热点话题关联的各个资讯事件,查找与待追溯热点话题关联的历史相似资讯事件,不仅能够大大提高对历史资讯进行追溯的效率,而且能够更加全面地展示待追溯热点话题的资讯信息。
[0097] 在一种可选的实施例中,本发明实施例中提供的热点话题追溯装置中,知识图谱查找模块902还用于根据待追溯热点话题关联的各个资讯事件的事件信息,从知识图谱中查找与待追溯热点话题关联各个资讯事件的相似度高于预设阈值的一个或多个资讯事件,并将相似度高于预设阈值的一个或多个资讯事件确定为待追溯热点话题关联的历史资讯事件;根据相似度高于预设阈值的各个资讯事件的事件信息,从知识图谱中查找相似度高于预设阈值的各个资讯事件关联的热点话题,将查找到的热点话题确定为待追溯热点话题的相似热点话题,并将相似热点话题关联的各个资讯事件确定为待追溯热点话题关联的历史资讯事件。
[0098] 可选地,本发明实施例中每个资讯事件的事件信息至少包含每个资讯事件的标题和概要内容,因而,在一种可选的实施例中,本发明实施例中提供的热点话题追溯装置还可以包括:资讯事件相似度确定模块905,用于将待追溯热点话题关联各个资讯事件的标题与知识图谱中各个热点话题关联的各个资讯事件的标题进行比对,计算第一相似度;将待追溯热点话题关联各个资讯事件的概要内容与知识图谱中各个热点话题关联各个资讯事件的概要内容进行比对,计算第二相似度;根据第一相似度和/或第二相似度,确定知识图谱中各个资讯事件与待追溯热点话题关联各个资讯事件的相似度。
[0099] 在一种可选的实施例中,本发明实施例中提供的热点话题追溯装置还可以包括:资讯事件信息提取模块906,用于根据各个资讯事件的事件信息,提取各个资讯事件的标题和概要内容。
[0100] 基于上述实施例,作为第一种可选的实施方式,上述资讯事件信息提取模块906还用于采集每个资讯事件关联的各个资讯的热度信息;根据每个资讯事件关联的各个资讯的热度信息,计算每个资讯事件关联的各个资讯的热度指标;根据最大热度指标对应的资讯,提取每个资讯事件的标题和概要内容。
[0101] 基于上述实施例,作为第二种可选的实施方式,上述资讯事件信息提取模块906还用于计每个资讯事件关联的各个资讯中预设关键词的出现次数;根据预设关键词出现最多次数的资讯,提取每个资讯事件的标题和概要内容。
[0102] 在一种可选的实施例中,本发明实施例中提供的热点话题追溯装置还可以包括:热点话题构建模块907,用于采集多个资讯平台的资讯信息;根据多个资讯平台的资讯信息,构建一个或多个热点话题。
[0103] 可选地,上述热点话题构建模块907,还用于将多个资讯平台的资讯信息归类为一个或多个资讯话题;实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题关联所有资讯的点击数、点赞数或评论数;监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
[0104] 在一种可选的实施例中,本发明实施例中提供的热点话题追溯装置还可以包括:热点话题监测模块908,用于监测每个热点话题的持续时间段;根据每个热点话题的持续时间段,确定每个热点话题对应的第二预设阈值。
[0105] 在一种可选的实施例中,本发明实施例中提供的热点话题追溯装置还可以包括:热度曲线绘制模块909,用于根据各个资讯事件关联的资讯信息,统计各个资讯事件的热度信息;根据各个资讯事件的热度信息,计算各个资讯事件的热度指标;根据待追溯热点话题关联各个资讯事件的热度指标,绘制待追溯热点话题的热度曲线;展示待追溯热点话题的热度曲线。
[0106] 在一种可选的实施例中,本发明实施例中提供的热点话题追溯装置还可以包括:产品价格曲线绘制模块910,用于根根据待追溯热点话题和待追溯热点话题关联的各个资讯事件,从知识图谱中查询待追溯热点话题关联一个或多个金融市场产品;采集待追溯热点话题关联一个或多个金融市场产品的价格数据;根据待追溯热点话题关联各个金融市场产品的价格数据,绘制待追溯热点话题关联各个金融市场产品在待追溯热点话题持续时间段内的价格曲线;展示待追溯热点话题关联各个金融市场产品的价格曲线。
[0107] 在一种可选的实施例中,本发明实施例中提供的热点话题追溯装置还可以包括:产品价格波动率计算模块911,用于根据每个资讯事件的事件信息,从知识图谱中查找每个资讯事件关联的一个或多个金融市场产品;采集每个资讯事件关联各个金融市场产品的价格数据;根据每个资讯事件关联各个金融市场产品的价格数据,计算每个资讯事件对各个金融市场产品价格变化影响的价格波动率;输出各个资讯事件对各个金融市场产品价格变化影响的价格波动率。
[0108] 可选地,上述产品价格波动率计算模块911还用于获取每个资讯事件对应的第一时间戳和第二时间戳,其中,第一时间戳为每个资讯事件发生时刻之前的一个时刻,第二时间戳为每个资讯事件发生时刻之后的一个时刻;根据每个资讯事件对应的第一时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个资讯事件发生之前的第一价格;根据每个资讯事件对应的第二时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个资讯事件发生之后的第二价格;根据第一价格和第二价格,确定每个资讯事件对金融市场产品价格变化影响的价格波动率。
[0109] 可选地,上述产品价格波动率计算模块911还用于判断第一时间戳是否落入金融市场产品产生价格数据的价格时间段内;如果第一时间戳落入金融市场产品产生价格数据的价格时间段内,则将金融市场产品产生价格数据的价格时间段内第一时间戳到每个资讯事件发生时刻之间金融市场产品的平均价格或第一时间戳对应金融市场产品的价格,确定为金融市场产品在每个资讯事件发生之前的第一价格;如果第一时间戳未落入金融市场产品产生价格数据对应的时间段内,则将第一时间戳之前且与第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为金融市场产品在每个资讯事件发生之前的第一价格。
[0110] 可选地,上述产品价格波动率计算模块911还用于判断第二时间戳是否落入金融市场产品产生价格数据的价格时间段内;如果第二时间戳落入金融市场产品产生价格数据的价格时间段内,则将金融市场产品产生价格数据的价格时间段内每个资讯事件发生时刻到第二时间戳之间金融市场产品的平均价格或第二时间戳对应金融市场产品的价格,确定为金融市场产品在每个资讯事件发生之后的第二价格;如果第二时间戳未落入金融市场产品产生价格数据对应的时间段内,则将在第二时间戳之后且与第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为金融市场产品在每个资讯事件发生之后的第二价格。
[0111] 在一种可选的实施例中,本发明实施例中提供的热点话题追溯装置还可以包括:热点话题日志信息展示模块912,用于获取用户关注的一个或多个金融市场产品的产品信息;根据各个金融市场产品的产品信息,从知识图谱中查找与各个金融市场产品关联的一个或多个热点话题;在界面上展示与每个金融市场产品关联的各个热点话题;接收话题选择指令,其中,话题选择指令用于选择任意一个热点话题作为待追溯热点话题;通过可视化图表展示待追溯热点话题的日志信息,其中,日志信息中至少包括:待追溯热点话题关联的各个资讯事件的标题、概要内容和热度信息,每个资讯事件的热度信息包含每个资讯事件关联的一个或多个资讯的点击数、点赞数或评论数。
[0112] 本发明实施例还提供了一种计算机设备,用以解决现有资讯平台通过搜索关键词的方式,来实现对历史资讯信息进行追溯,导致对某个热点话题的资讯信息追溯效率低,信息不全面的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于知识图谱的热点话题追溯方法。
[0113] 本发明实施例还提供了一种计算机可读存储介质,用以解决现有资讯平台通过搜索关键词的方式,来实现对历史资讯信息进行追溯,导致对某个热点话题的资讯信息追溯效率低,信息不全面的技术问题,该计算机可读存储介质存储有执行上述基于知识图谱的热点话题追溯方法的计算机程序。
[0114] 综上所述,本发明实施例提供了一种基于知识图谱的热点话题追溯方法、装置、计算机设备及计算机可读存储介质,在获取到待追溯热点话题关联的一个或多个资讯事件的事件信息后,根据待追溯热点话题关联的各个资讯事件的事件信息,从预先构建的知识图谱中查找待追溯热点话题关联的一个或多个历史资讯事件,采集待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息,并输出待追溯热点话题关联各个资讯事件和历史资讯事件关联的资讯信息。
[0115] 通过本发明实施例,基于待追溯热点话题关联的各个资讯事件,查找与待追溯热点话题关联的历史相似资讯事件,不仅能够大大提高对历史资讯进行追溯的效率,而且能够更加全面地展示待追溯热点话题的资讯信息。
[0116] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0117] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0118] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0119] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0120] 以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈