首页 / 专利库 / 专利权 / 第I章 / 国际申请 / 摘要 / 摘要生成方法及装置

摘要生成方法及装置

阅读:33发布:2020-05-11

专利汇可以提供摘要生成方法及装置专利检索,专利查询,专利分析的服务。并且本公开 实施例 提供一种 摘要 生成方法及装置,该方法包括:接收用户输入的第一对象的至少一个关键词;基于所述至少一个关键词,获取所述第一对象对应的摘要模板,所述摘要模板中包括模板内容、至少一个待填充内容,所述摘要模板为根据预设摘要生成的,所述预设摘要的点击率大于第一 阈值 ;基于所述至少一个关键词和所述摘要模板,生成所述第一对象的摘要。本公开实施例无需人工撰写摘要文本,减轻了用户的负担。,下面是摘要生成方法及装置专利的具体信息内容。

1.一种摘要生成方法,其特征在于,包括:
接收用户输入的第一对象的至少一个关键词;
基于所述至少一个关键词,获取所述第一对象对应的摘要模板,所述摘要模板中包括模板内容、至少一个待填充内容,所述摘要模板为根据预设摘要生成的,所述预设摘要的点击率大于第一阈值
基于所述至少一个关键词和所述摘要模板,生成所述第一对象的摘要。
2.根据权利要求1所述的方法,其特征在于,基于所述至少一个关键词和所述摘要模板,生成所述第一对象的摘要,包括:
获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别;
获取所述摘要模板中每个待填充内容对应的实体类别;
基于每个关键词对应的实体类别和每个待填充内容对应的实体类别,生成所述第一对象的摘要。
3.根据权利要求2所述的方法,其特征在于,基于每个关键词对应的实体类别和每个待填充内容对应的实体类别,生成所述第一对象的摘要,包括:
根据每个关键词对应的实体类别和每个待填充内容对应的实体类别,确定所述至少一个关键词和所述至少一个待填充内容之间的对应关系;
根据所述对应关系,将所述至少一个关键词填充至所述摘要模板的待填充内容中,得到所述第一对象的摘要。
4.根据权利要求1-3任一项所述的方法,其特征在于,基于所述至少一个关键词,获取所述第一对象对应的摘要模板,包括:
获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别;
根据每个关键词对应的实体类别,确定所述第一对象的对象类别;
基于所述第一对象的对象类型,获取所述第一对象对应的摘要模板,所述第一对象的对象类型与所述摘要模板对应的对象类型相同。
5.根据权利要求1-4任一项所述的方法,其特征在于,基于所述至少一个关键词,获取所述第一对象对应的摘要模板之前,还包括:
获取预设摘要,所述预设摘要的点击率大于第一阈值;
基于所述预设摘要生成所述摘要模板。
6.根据权利要求5所述的方法,其特征在于,基于所述预设摘要生成所述摘要模板,包括:
将所述预设摘要输入至命名实体识别模型,得到所述命名实体识别模型输出的所述预设摘要中每个词汇的实体类别;
根据所述预设摘要中每个词汇的实体类别,生成所述摘要模板。
7.根据权利要求6所述的方法,其特征在于,根据所述预设摘要中每个词汇的实体类别,生成所述摘要模板,包括:
获取第一实体类别集合和第二实体类别集合;
将所述预设摘要中的第一词汇确定为所述模板内容,所述第一词汇的实体类别位于所述第一实体类别集合;
删除所述预设摘要中的第二词汇,并将所述第二词汇所在位置的内容确定为所述待填充内容,所述第二词汇的实体类别位于所述第二实体类别集合。
8.根据权利要求1-7任一项所述的方法,其特征在于,生成的所述第一对象的摘要的数量大于1,所述方法还包括:
基于至少两个摘要对应的摘要模板的权重值,展示所述第一对象的至少两个摘要;
接收用户在所述至少两个摘要中选择的目标摘要;
将所述目标摘要确定为所述第一对象的摘要。
9.根据权利要求8所述的方法,其特征在于,将所述目标摘要确定为所述第一对象的摘要之后,还包括:
根据所述目标摘要,更新所述至少两个摘要对应的摘要模板的权重值。
10.一种摘要生成装置,其特征在于,包括:
接收模,用于接收用户输入的第一对象的至少一个关键词;
获取模块,用于基于所述至少一个关键词,获取所述第一对象对应的摘要模板,所述摘要模板中包括模板内容、至少一个待填充内容,所述摘要模板为根据预设摘要生成的,所述预设摘要的点击率大于第一阈值;
处理模块,用于基于所述至少一个关键词和所述摘要模板,生成所述第一对象的摘要。
11.一种电子设备,其特征在于,包括:至少一个处理器和存储器
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至9任一项所述的摘要生成方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至9任一项所述的摘要生成方法。

说明书全文

摘要生成方法及装置

技术领域

[0001] 本公开实施例涉及互联网技术领域,尤其涉及一种摘要生成方法及装置。

背景技术

[0002] 随着移动终端性能的提高,越来越多的用户使用移动终端进行信息的阅览、商品的购买等操作。
[0003] 为了能够快速展示文本或视频等信息数据,需要为信息数据生成较简短的摘要,使得用户通过摘要就能够获取到信息数据的基本内容或重点,便于用户的预览。目前,摘要的生成方式主要是通过用户自己来书写摘要文本,然后进行上传,以在终端界面进行展示。当用户需要经常展示信息时,频繁的摘要书写对用户会产生较大的负担。
发明内容
[0004] 本公开实施例提供一种摘要生成方法及装置,以解决现有方案生成摘要对用户产生较大的负担的问题。
[0005] 第一方面,本公开实施例提供一种摘要生成方法,包括:
[0006] 接收用户输入的第一对象的至少一个关键词;
[0007] 基于所述至少一个关键词,获取所述第一对象对应的摘要模板,所述摘要模板中包括模板内容、至少一个待填充内容,所述摘要模板为根据预设摘要生成的,所述预设摘要的点击率大于第一阈值
[0008] 基于所述至少一个关键词和所述摘要模板,生成所述第一对象的摘要。
[0009] 在一种可能的实现方式中,基于所述至少一个关键词和所述摘要模板,生成所述第一对象的摘要,包括:
[0010] 获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别;
[0011] 获取所述摘要模板中每个待填充内容对应的实体类别;
[0012] 基于每个关键词对应的实体类别和每个待填充内容对应的实体类别,生成所述第一对象的摘要。
[0013] 在一种可能的实现方式中,基于每个关键词对应的实体类别和每个待填充内容对应的实体类别,生成所述第一对象的摘要,包括:
[0014] 根据每个关键词对应的实体类别和每个待填充内容对应的实体类别,确定所述至少一个关键词和所述至少一个待填充内容之间的对应关系;
[0015] 根据所述对应关系,将所述至少一个关键词填充至所述摘要模板的待填充内容中,得到所述第一对象的摘要。
[0016] 在一种可能的实现方式中,基于所述至少一个关键词,获取所述第一对象对应的摘要模板,包括:
[0017] 获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别;
[0018] 根据每个关键词对应的实体类别,确定所述第一对象的对象类别;
[0019] 基于所述第一对象的对象类型,获取所述第一对象对应的摘要模板,所述第一对象的对象类型与所述摘要模板对应的对象类型相同。
[0020] 在一种可能的实现方式中,基于所述至少一个关键词,获取所述第一对象对应的摘要模板之前,还包括:
[0021] 获取预设摘要,所述预设摘要的点击率大于第一阈值;
[0022] 基于所述预设摘要生成所述摘要模板。
[0023] 在一种可能的实现方式中,基于所述预设摘要生成所述摘要模板,包括:
[0024] 将所述预设摘要输入至命名实体识别模型,得到所述命名实体识别模型输出的所述预设摘要中每个词汇的实体类别;
[0025] 根据所述预设摘要中每个词汇的实体类别,生成所述摘要模板。
[0026] 在一种可能的实现方式中,根据所述预设摘要中每个词汇的实体类别,生成所述摘要模板,包括:
[0027] 获取第一实体类别集合和第二实体类别集合;
[0028] 将所述预设摘要中的第一词汇确定为所述模板内容,所述第一词汇的实体类别位于所述第一实体类别集合;
[0029] 删除所述预设摘要中的第二词汇,并将所述第二词汇所在位置的内容确定为所述待填充内容,所述第二词汇的实体类别位于所述第二实体类别集合。
[0030] 在一种可能的实现方式中,生成的所述第一对象的摘要的数量大于1,所述方法还包括:
[0031] 基于所述至少两个摘要对应的摘要模板的权重值,展示所述第一对象的至少两个摘要;
[0032] 接收用户在所述至少两个摘要中选择的目标摘要;
[0033] 将所述目标摘要确定为所述第一对象的摘要。
[0034] 在一种可能的实现方式中,将所述目标摘要确定为所述第一对象的摘要之后,还包括:
[0035] 根据所述目标摘要,更新所述至少两个摘要对应的摘要模板的权重值。
[0036] 第二方面,本公开实施例提供一种摘要生成装置,包括:
[0037] 接收模,用于接收用户输入的第一对象的至少一个关键词;
[0038] 获取模块,用于基于所述至少一个关键词,获取所述第一对象对应的摘要模板,所述摘要模板中包括模板内容、至少一个待填充内容,所述摘要模板为根据预设摘要生成的,所述预设摘要的点击率大于第一阈值;
[0039] 处理模块,用于基于所述至少一个关键词和所述摘要模板,生成所述第一对象的摘要。
[0040] 在一种可能的实现方式中,所述处理模块具体用于:
[0041] 获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别;
[0042] 获取所述摘要模板中每个待填充内容对应的实体类别;
[0043] 基于每个关键词对应的实体类别和每个待填充内容对应的实体类别,生成所述第一对象的摘要。
[0044] 在一种可能的实现方式中,所述处理模块具体用于:
[0045] 根据每个关键词对应的实体类别和每个待填充内容对应的实体类别,确定所述至少一个关键词和所述至少一个待填充内容之间的对应关系;
[0046] 根据所述对应关系,将所述至少一个关键词填充至所述摘要模板的待填充内容中,得到所述第一对象的摘要。
[0047] 在一种可能的实现方式中,所述获取模块具体用于:
[0048] 获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别;
[0049] 根据每个关键词对应的实体类别,确定所述第一对象的对象类别;
[0050] 基于所述第一对象的对象类型,获取所述第一对象对应的摘要模板,所述第一对象的对象类型与所述摘要模板对应的对象类型相同。
[0051] 在一种可能的实现方式中,所述获取模块还用于:
[0052] 获取预设摘要,所述预设摘要的点击率大于第一阈值;
[0053] 基于所述预设摘要生成所述摘要模板。
[0054] 在一种可能的实现方式中,所述获取模块还用于:
[0055] 将所述预设摘要输入至命名实体识别模型,得到所述命名实体识别模型输出的所述预设摘要中每个词汇的实体类别;
[0056] 根据所述预设摘要中每个词汇的实体类别,生成所述摘要模板。
[0057] 在一种可能的实现方式中,所述获取模块还用于:
[0058] 获取第一实体类别集合和第二实体类别集合;
[0059] 将所述预设摘要中的第一词汇确定为所述模板内容,所述第一词汇的实体类别位于所述第一实体类别集合;
[0060] 删除所述预设摘要中的第二词汇,并将所述第二词汇所在位置的内容确定为所述待填充内容,所述第二词汇的实体类别位于所述第二实体类别集合。
[0061] 在一种可能的实现方式中,所述处理模块还用于,在生成的所述第一对象的摘要的数量大于1时:
[0062] 基于所述至少两个摘要对应的摘要模板的权重值,展示所述第一对象的至少两个摘要;
[0063] 接收用户在所述至少两个摘要中选择的目标摘要;
[0064] 将所述目标摘要确定为所述第一对象的摘要。
[0065] 在一种可能的实现方式中,所述处理模块还用于,将所述目标摘要确定为所述第一对象的摘要之后:
[0066] 根据所述目标摘要,更新所述至少两个摘要对应的摘要模板的权重值。
[0067] 第三方面,本公开实施例提供一种电子设备,包括:至少一个处理器和存储器
[0068] 所述存储器存储计算机执行指令;
[0069] 所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的摘要生成方法。
[0070] 第四方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的摘要生成方法。
[0071] 本公开实施例提供的摘要生成方法及装置,首先接收用户输入的第一对象的至少一个关键词,然后基于至少一个关键词,获取第一对象对应的摘要模板,最后基于至少一个关键词和摘要模板,生成第一对象的摘要。当用户需要得到第一对象的摘要时,只需要输入第一对象相关的一个或几个关键词,本公开实施例提供的方案能够根据用户输入的关键词得到相应的摘要模板,摘要模板中包括模板内容和待填充内容,然后,将用户输入的关键词添加到摘要模板的待填充内容处,得到第一对象的摘要,实现了在输入较少的关键词汇的前提下生成对应的摘要,而无需人工撰写摘要文本,减轻了用户的负担。附图说明
[0072] 为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0073] 图1为本公开实施例提供的一种应用场景示意图;
[0074] 图2为本公开实施例提供的摘要生成方法的流程示意图;
[0075] 图3为本公开实施例提供的摘要生成示意图;
[0076] 图4为本公开又一实施例提供的摘要生成方法的流程示意图;
[0077] 图5为本公开实施例提供的获取摘要模板的流程示意图;
[0078] 图6为本公开实施例提供的摘要模板生成示意图;
[0079] 图7为本公开实施例提供的摘要模板填充示意图;
[0080] 图8为本公开实施例提供的关键词填充示意图;
[0081] 图9为本公开实施例提供的多摘要生成展示示意图;
[0082] 图10为本公开实施例提供的摘要生成装置的结构示意图;
[0083] 图11为本公开实施例提供的电子设备的结构示意图。

具体实施方式

[0084] 为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0085] 图1为本公开实施例提供的一种应用场景示意图,如图1所示,用户希望在资讯平台展示相关的信息。例如,用户可以在资讯平台投放广告,可以在资讯平台发表文章、视频等等。
[0086] 由于用户需要在资讯平台展示相关的信息,而相关的信息可能需要占据较大的篇幅,因此通常需要根据用户展示的相关信息生成较为简短的摘要,发布在资讯平台上。当其他用户在浏览资讯平台时,首先获取到的就是各个信息的摘要,根据各个信息的摘要来选择想要查看的信息。
[0087] 由此可见,摘要通常是决定其他用户是否对相关的信息进行点击和查看的关键,因此生成一个简短又能够吸引人的摘要,对相关信息的发布和推广尤为重要。
[0088] 现有的方案生成摘要的方式通常是由需要发布相关信息的用户来撰写摘要文本,摘要文本的撰写对用户是一个较大的负担。本公开实施例要实现的是,在图1示例的终端设备中,输入与想要展示的信息相关的关键词例如“衬衫”、“凉快”和“298”,然后就能够得到展示信息的摘要,其中,生成的摘要可以有一个或多个,从而供用户选择最想要的摘要文本,图1中生成的示例摘要为“没别的就是凉快!短款印花衬衫仅售298元!”。
[0089] 需要说明的是,图1所示的应用场景仅是一种示例,本公开实施例提供的摘要生成方法还可以应用于更多其他场景中,例如除应用于资讯平台上之外,还可以应用于社交平台、搜索平台等等,执行操作步骤的装置可以如图1中示例的终端设备,也可以是其他可能的电子设备,本公开实施例不一一列举。
[0090] 下面,通过具体实施例对本公开所示的技术方案进行详细说明。需要说明的是,下面几个具体实施例可以相互结合,对于相同或相似的内容,在不同的实施例中不再进行重复说明。
[0091] 图2为本公开实施例提供的摘要生成方法的流程示意图,如图2所示,包括:
[0092] S21,接收用户输入的第一对象的至少一个关键词;
[0093] 本公开实施例的执行主体为电子设备,或者设置在电子设备中的文本处理装置。可选的,文本处理装置可以通过软件实现,也可以通过软件和硬件的结合实现。可选的,电子设备可以为电脑、服务器、手机等设备。
[0094] 本公开实施例中的第一对象为要展示的信息的相关对象,例如,在广告投放领域,假设广告所宣传的商品为衬衫,则第一对象为衬衫;在视频领域,假设视频是有关旅游宣传的,则第一对象为旅游相关对象,如旅游目的地、旅游等。
[0095] 用户需要展示第一对象的相关信息并生成摘要时,可以输入至少一个关键词,关键词能够表达出第一对象的关键特征或者用户希望在摘要里体现的关键点。例如,在广告投放领域,第一对象为商品时,第一对象的关键词可以是商品的卖点、折扣优惠、价格等等。
[0096] 可以理解的是,关键词可以为不同语言下的词,本公开实施例中,词可以是文字的形式,也可以是数字的形式,还可以包括字符,进一步的,关键词也可以为文字、数字、字符等中的两种或多种的组合形式表示。例如,若用户希望在摘要中显示商品的价格,价格为32美元时,可以输入一个有关价格的关键词:$32。
[0097] S22,基于所述至少一个关键词,获取所述第一对象对应的摘要模板,所述摘要模板中包括模板内容、至少一个待填充内容,所述摘要模板为根据预设摘要生成的,所述预设摘要的点击率大于第一阈值;
[0098] 得到至少一个关键词后,根据这至少一个关键词获取关于第一对象对应的摘要模板。其中,摘要模板可以有多个,不同的摘要模板对应于不同的摘要。当确定了摘要的关键词后,根据关键词能够得到与关键词对应的摘要模板。下面将结合图3对该过程进行说明。
[0099] 图3为本公开实施例提供的摘要生成示意图,如图3所示,首先要根据预设摘要生成相应的摘要模板。本公开实施例中,预设摘要是已经发布的摘要,且预设摘要的点击率大于第一阈值。当已经发布的摘要的点击率较高时,表明该摘要有许多人查看,因此该摘要为一个较为吸引客户的摘要的可能性更大。因此,本公开实施例在获取预设摘要时,仅针对点击率大于第一阈值的摘要进行获取。第一阈值为正数,第一阈值的获取可根据实际需要确定,本公开实施例对此不作特别限定。
[0100] 图3中示例了两个预设摘要,均为针对服装类商品的摘要,分别是预设摘要一和预设摘要二,两个预设摘要的内容如下:
[0101] 预设摘要一,“一件衣,让您的气质与众不同”。
[0102] 预设摘要一,“男士首选,成就西装经典,新季西装仅售999元”。
[0103] 在得到这两个预设摘要后,根据这两个预设摘要得到对应的两个摘要模板。
[0104] 例如,针对上述预设摘要一得到摘要模板一,针对上述预设摘要二得到摘要模板二,两个摘要模板如下:
[0105] 摘要模板一,“一件{商品名称},让您的气质与众不同”。
[0106] 摘要模板一,“男士首选,成就{商品名称}经典,新季{商品名称}仅售{商品价格}元”。
[0107] 在摘要模板中,包括模板内容和至少一个待填充内容,其中模板内容是需要进行保留的,而待填充内容是需要根据用户输入的关键词进行填充的。在后续生成的摘要中,包括保留的模板内容和采用用户输入的关键词填充的待填充内容。例如,在摘要模板一中,模板内容为“一件____,让您的气质与众不同”,而待填充内容即为商品名称;在摘要模板二中,模板内容为“男士首选,成就____经典,新季____仅售____元”,待填充内容包括商品名称和商品价格。
[0108] 摘要模板一和摘要模板二均为摘要模板,但是两个模板各有不同。在摘要模板一中,主要突出的是商品的名称,即摘要的主题,需要填充的内容也是商品的名称。在摘要模板二中,除了需要填充商品的名称外,还需要填充商品的价格。因此,当用户输入的关键词包括仅商品名称时,能够得到该关键词对应的摘要模板一,当用户输入的关键词包括商品名称和商品价格时,能够得到这两个关键词对应的摘要模板二,当用户输入的关键词除了包括商品名称和商品价格外还包括其他类型的关键词,则摘要模板一和摘要模板二均不符合用户的需要,需要根据用户输入的关键词寻找其他符合用户需求的摘要模板,等等。
[0109] 例如,当用户输入的关键词为“毛衣”时,“毛衣”为服装类别,即商品名称的一种,根据关键词“毛衣”能够获取到图3中示例的摘要模板一。当用户输入的关键词为“毛衣”和“200”时,“200”为数字,是商品价格的表示,根据关键词“毛衣”和“200”能够获取到图3中示例的摘要模板二。当用户输入的关键词为“毛衣”和“好看”时,“好看”是对商品的描述,也为商品的卖点,在摘要模板一和摘要模板二中均没有针对商品卖点的待填充内容,因此此时摘要模板一和摘要模板二不符合用户此时的需求,需要获取其他的摘要模板来实现对商品名称和商品卖点的填充。
[0110] S23,基于所述至少一个关键词和所述摘要模板,生成所述第一对象的摘要。
[0111] 在得到至少一个关键词和摘要模板后,根据关键词和摘要模板得到第一对象的摘要。由于摘要模板是根据关键词得到的,因此得到的摘要模板是与关键词对应的,可以根据关键词和摘要模板的对应关系来将关键词填充到摘要模板的待填充处。例如,用户输入关键词“毛衣”时,将“毛衣”填充到摘要模板一的商品名称对应的待填充处,得到此时的摘要为:一件风衣,让您的气质与众不同。用户输入关键词“毛衣”和“200”时,将“毛衣”填充到摘要模板二的商品名称对应的待填充处,将“200”填充到摘要模板二的商品价格对应的待填充处,得到此时的摘要为:男士首选,成就毛衣经典,新季毛衣仅售200元。
[0112] 若针对输入的关键词有多个模板,相应的生成了多个摘要,用户可以根据自身的喜好选择其中的一个作为第一对象的摘要,进行展示。
[0113] 本公开实施例提供的摘要生成方法,首先接收用户输入的第一对象的至少一个关键词,然后基于至少一个关键词,获取第一对象对应的摘要模板,最后基于至少一个关键词和摘要模板,生成第一对象的摘要。当用户需要得到第一对象的摘要时,只需要输入第一对象相关的一个或几个关键词,本公开实施例提供的方案能够根据用户输入的关键词得到相应的摘要模板,摘要模板中包括模板内容和待填充内容,然后,将用户输入的关键词添加到摘要模板的待填充内容处,得到第一对象的摘要,实现了在输入较少的关键词汇的前提下生成对应的摘要,而无需人工撰写摘要文本,减轻了用户的负担。
[0114] 在上述实施例的基础上,下面以具体的实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
[0115] 图4为本公开又一实施例提供的摘要生成方法的流程示意图,如图4所示,包括:
[0116] S41,接收用户输入的第一对象的至少一个关键词。
[0117] 其中,S41的具体实施方式与图2中的S21类似,此处不再赘述。
[0118] S42,获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别。
[0119] 本公开实施例中,实体类别表示的是关键词的类别,在根据关键词生成摘要之前,需要根据关键词的实体类别来进行生成操作。仍以广告领域为例,当输入的关键词为“衬衫”时,“衬衫”的实体类别为商品或商品名称,当输入的关键词为“$32”时,“$32”的实体类别为价格,当输入的关键词为“凉快”时,“凉快”的实体类别为商品卖点或商品优势,当输入的关键词为“纯”时,“纯棉”的实体类别为商品材料等等。
[0120] 由于关键词是用户希望体现在摘要里的,因此根据关键词的实体类别,能够将关键词设置于摘要模板的相应位置。
[0121] S43,根据每个关键词对应的实体类别,确定所述第一对象的对象类别;
[0122] 得到关键词的实体类别后,需要根据每个关键词的实体类别来确定第一对象的对象类别。例如,关键词为“衬衫”,则关键词的实体类别为商品,根据实体类别为商品的关键词“衬衫”,能够进一步确定第一对象的对象类别为服装类商品,进一步确定了第一对象的相关信息。
[0123] S44,基于所述第一对象的对象类型,获取所述第一对象对应的摘要模板,所述第一对象的对象类型与所述摘要模板对应的对象类型相同。
[0124] 在获取第一对象对应的摘要模板之前,首先要获取多个摘要模板,下面将结合图5对该过程进行说明。
[0125] 图5为本公开实施例提供的获取摘要模板的流程示意图,如图5所示,包括:
[0126] S51,获取预设摘要,所述预设摘要的点击率大于第一阈值;
[0127] 在各种平台或者网页上,均有多种摘要。当需要广告领域的摘要时,在在平台或网页上搜索广告领域投放的广告摘要;当需要视频领域的摘要时,在平台或网页上搜索视频领域的摘要;当需要教育培训领域的摘要时,在平台或网页上搜索教育培训领域的摘要,等等。
[0128] 由于信息繁杂,因此本公开实施例中只选择点击率大于第一阈值的摘要作为预设摘要,这是由于,点击率在一定程度上是用户对摘要内容的直观反映和评价。点击率高的摘要相对于点击率低的摘要而言,受欢迎的程度、对用户的吸引度等方面更优越的可能性较大,因此只需要获取点击率大于第一阈值的摘要。
[0129] S52,基于所述预设摘要生成所述摘要模板。
[0130] 具体的,将预设摘要输入至命名实体识别模型,得到命名实体识别模型输出的预设摘要中每个词汇的实体类别。
[0131] 在得到每个词汇的实体类别后,根据预设摘要中每个词汇的实体类别,即可生成摘要模板。例如,首先获取第一实体类别集合和第二实体类别集合,然后将预设摘要中的第一词汇确定为模板内容,删除预设摘要中的第二词汇,并将第二词汇所在位置的内容确定为待填充内容,其中,第一词汇的实体类别位于第一实体类别集合,第二词汇的实体类别位于第二实体类别集合。
[0132] 命名实体识别指的是信息提取的一个子任务,是用于将文本中的命名实体定位并分类为预先定义的类别,例如人员、组织、位置、时间、数量等等,命名实体识别模型即为能够实现命名实体识别功能的模型。命名实体识别模型可以采用机器学习的方法进行训练,本公开实施例中,需要将预设摘要输入至命名实体识别模型,得到命名实体识别模型输出的每个词汇的实体类别。
[0133] 在对命名实体识别模型进行训练之前,首先要确定预先定义的类别,本公开实施例中,主要包括两个大的类别,分别是第一实体类别和第二实体类别,其中,第一实体类别中的词汇需要保留到摘要模板中,第二实体类别中的词汇需要删除,作为摘要模板中的待填充内容。针对不同的领域,对第一实体类别和第二实体类别中的词汇的划分可能会有部分区别。
[0134] 以广告投放领域为例,当需要在广告投放领域生成针对服装的摘要时,第二实体类别中可以包括商品名称、商品价格、商品卖点等内容,其余内容可以作为第一实体类别的内容。因此,用户在使用摘要模板时,只需要输入与商品名称、商品价格、商品卖点等相关的关键词即可。
[0135] 然后将摘要模板中属于第一词汇的内容保留,将关键词填充到相应的待填充内容处,得到第一对象的摘要。
[0136] 图6为本公开实施例提供的摘要模板生成示意图,如图6所示,输入的预设摘要为:男士首选,成就衬衫经典,新季衬衫仅售298元。
[0137] 将该预设摘要输入至命名实体识别模型后,得到模型输出的预设摘要中每个词汇的实体类别,得到第一实体类别集合和第二实体类别集合。在图6中,第一实体类别集合中的词汇以方框表示,第二实体类别集合中的词汇以下划线表示。该摘要中属于第一实体类别集合的词汇包括:男士首选、成就、经典、新季、仅售,属于第二实体类别集合的词汇包括:衬衫、衬衫、298元。
[0138] 然后,将该预设摘要中属于第一实体类别集合的词汇作为该预设摘要生成的摘要模板中的固定内容,且词汇之间的相对位置不变,而属于第二实体类别集合的词汇进行删除,即删除该预设摘要中的“衬衫”、“衬衫”和“298元”,删除之后的空位为待填充内容,需要填充入相应的词汇。
[0139] 在进行上述操作后,即可得到该预设摘要生成的摘要模板:
[0140] 男士首选,成就____经典,新季____仅售____元。
[0141] 需要说明的是,本公开实施例中,得到第一对象的对象类型后,进而获取第一对象对应摘要模板,且第一对象的对象类型与摘要模板对应的对象类型相同。例如,若第一对象的对象类型为服装类商品,则获取的摘要模板的对象类型为服装类商品的对象类型,若第一对象的对象类型为食品类商品,则获取的摘要模板的对象类型为电子类商品的对象类型。下面将结合图7对该过程进行说明。
[0142] 图7为本公开实施例提供的摘要模板填充示意图,如图7所示,包括一个服装类的预设摘要:
[0143] 男士首选,成就衬衫经典,新季衬衫仅售298元。
[0144] 该预设摘要生成的摘要模板为:
[0145] 男士首选,成就____经典,新季____仅售____元。
[0146] 上述摘要模板为一个针对服装类的摘要模板,只能用于服装类商品。若应用于其他范围,则可能产生不适宜的摘要。例如,若用户需要宣传的产品为奶,在输入关键词“牛奶”和“20”后,得到的摘要为:
[0147] 男士首选,成就牛奶经典,新季牛奶仅售20元。
[0148] 上述生成的摘要明显不适宜用于牛奶的宣传。本公开实施例中,在根据一个预设摘要生成一个相应的摘要模板后,可对生成的摘要模板进行标记,表示该摘要模板的适用范围。
[0149] S45,获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别。
[0150] 例如,关键词为“衬衫”,其对应的实体类别为商品名称,关键词为“凉快”,其对应的实体类别为“商品卖点”,等等。
[0151] S46,获取所述摘要模板中每个待填充内容对应的实体类别。
[0152] 在将关键词填入摘要模板中的待填充内容处时,也需要获取摘要模板中待填充内容对应的实体类别,从而将关键词的类别和待填充内容对应的实体类别进行对应填充。
[0153] S47,基于每个关键词对应的实体类别和每个待填充内容对应的实体类别,生成所述第一对象的摘要。
[0154] 具体的,根据每个关键词对应的实体类别和每个待填充内容对应的实体类别,确定至少一个关键词和至少一个待填充内容之间的对应关系,然后,根据对应关系,将至少一个关键词填充至摘要模板的待填充内容中,得到第一对象的摘要。
[0155] 图8为本公开实施例提供的关键词填充示意图,如图8所示,包括一个预设摘要生成的摘要模板:
[0156] 没别的就是____!短款印花____仅售____。
[0157] 在该摘要模板中,主要的待填充内容处的实体类别包括商品卖点、商品名称和商品价格,而用户输入的关键词总共有三个,分别是“衬衫”、“凉快”和“298元”,这三个关键词中,“衬衫”对应的实体类别为商品名称,与上述摘要模板的第二个待填充内容相对应,应当填充到上述摘要模板的第二个待填充内容处,“凉快”对应的实体类别为商品卖点,与上述摘要模板的第一个待填充内容相对应,应当填充到上述摘要模板的第一个待填充内容处,“298元”对应的实体类别为商品价格,与上述摘要模板的第三个待填充内容相对应,应当填充到上述摘要模板的第三个待填充内容处,等等。
[0158] 根据上述填充后,得到的摘要为:
[0159] 没别的就是凉快!短款印花衬衫仅售298元。
[0160] 上述关键词的填充仅仅为一种举例,实际中关键词的实体类别并不限于以上几种,本公开实施例不再一一赘述。
[0161] 除了上述生成摘要的方法外,本公开实施例还提供一种摘要生成方法,首先获取用户输入的关键词,然后将用户输入的关键词输入至命名实体识别模型中,得到关键词和关键词对应的标签,关键词对应的标签反映了关键词的实体类别,命名实体识别模型的训练过程与上述实施例中类似,此处不再赘述。
[0162] 在得到关键词和关键词对应的标签后,将其输入到文本生成模型中,得到生成的摘要,其中,文本生成模型是根据训练样本集训练得到的。训练样本集中包括预设摘要、关键词和关键词对应的标签。关键词和与之对应的摘要中包括数百万平行的训练语料可以构成庞大的训练样本集,通过构建深度神经网络,例如seq2seq文本生成网络,对训练样本集进行训练直至模型收敛,得到文本生成模型。
[0163] 在生成摘要的过程中,根据输入的关键词得到的摘要模板可能有多个,此时需要对这多个进行展示,供用户进行选择。图9为本公开实施例提供的摘要生成展示示意图,如图9所示,本公开实施例可采取的方案是,基于至少两个摘要对应的摘要模板的权重值,展示第一对象的至少两个摘要,然后接收用户在至少两个摘要中选择的目标摘要,将目标摘要确定为第一对象的摘要。
[0164] 具体的,在每个摘要模板后面对每个摘要模板的点击率进行标注,并根据每个摘要模板的点击率进行先后排序,当用户选中的某个摘要模板,生成了目标摘要后,该摘要模板的点击率进行更新,并更新各摘要模板的权重值。
[0165] 在图9中,输入关键词“衬衫”后,生成了五条填充后的摘要,分别为:
[0166] 摘要一,“一件衬衫,让您的气质与众不同”;
[0167] 摘要二,“印花衬衫,精选品质,经典品味”;
[0168] 摘要三,“短款印花衬衫,质地柔软,富有弹性,抢到就是赚到”;
[0169] 摘要四,“短款衬衫,简明朴素,随意清洗不变形”;
[0170] 摘要五,“隆重推出新季衬衫,选料上乘,四季皆宜”。
[0171] 在上述五个摘要的模板后分别标注了对应的点击率,如图9中所示,五个摘要的点击次数依次为980次、1006次、5029次、3298次、4200次。
[0172] 由此可见,摘要三的点击率最高,表明查看的用户最多。此时摘要的点击率可以提供给用户进行参考,用户可以任意选择其中的一个作为选中的目标摘要。例如,当用户选中摘要四时,摘要四的点击次数将会更新为3299次。
[0173] 本公开实施例提供的摘要生成方法,首先接收用户输入的第一对象的至少一个关键词,然后基于至少一个关键词,获取第一对象对应的摘要模板,最后基于至少一个关键词和摘要模板,生成第一对象的摘要。当用户需要得到第一对象的摘要时,只需要输入第一对象相关的一个或几个关键词,本公开实施例提供的方案能够根据用户输入的关键词得到相应的摘要模板,摘要模板中包括模板内容和待填充内容,然后,将用户输入的关键词添加到摘要模板的待填充内容处,得到第一对象的摘要,实现了在输入较少的关键词汇的前提下生成对应的摘要,而无需人工撰写摘要文本,减轻了用户的负担。
[0174] 图10为本公开实施例提供的摘要生成装置的结构示意图,如图10所示,包括接收模块101、获取模块102和处理模块103,其中:
[0175] 接收模块101用于接收用户输入的第一对象的至少一个关键词;
[0176] 获取模块102用于基于所述至少一个关键词,获取所述第一对象对应的摘要模板,所述摘要模板中包括模板内容、至少一个待填充内容,所述摘要模板为根据预设摘要生成的,所述预设摘要的点击率大于第一阈值;
[0177] 处理模块103用于基于所述至少一个关键词和所述摘要模板,生成所述第一对象的摘要。
[0178] 在一种可能的实现方式中,所述处理模块103具体用于:
[0179] 获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别;
[0180] 获取所述摘要模板中每个待填充内容对应的实体类别;
[0181] 基于每个关键词对应的实体类别和每个待填充内容对应的实体类别,生成所述第一对象的摘要。
[0182] 在一种可能的实现方式中,所述处理模块103具体用于:
[0183] 根据每个关键词对应的实体类别和每个待填充内容对应的实体类别,确定所述至少一个关键词和所述至少一个待填充内容之间的对应关系;
[0184] 根据所述对应关系,将所述至少一个关键词填充至所述摘要模板的待填充内容中,得到所述第一对象的摘要。
[0185] 在一种可能的实现方式中,所述获取模块102具体用于:
[0186] 获取每个关键词对应的实体类别,所述实体类别用于指示所述关键词所指示的对象的类别;
[0187] 根据每个关键词对应的实体类别,确定所述第一对象的对象类别;
[0188] 基于所述第一对象的对象类型,获取所述第一对象对应的摘要模板,所述第一对象的对象类型与所述摘要模板对应的对象类型相同。
[0189] 在一种可能的实现方式中,所述获取模块102还用于:
[0190] 获取预设摘要,所述预设摘要的点击率大于第一阈值;
[0191] 基于所述预设摘要生成所述摘要模板。
[0192] 在一种可能的实现方式中,所述获取模块102还用于:
[0193] 将所述预设摘要输入至命名实体识别模型,得到所述命名实体识别模型输出的所述预设摘要中每个词汇的实体类别;
[0194] 根据所述预设摘要中每个词汇的实体类别,生成所述摘要模板。
[0195] 在一种可能的实现方式中,所述获取模块102还用于:
[0196] 获取第一实体类别集合和第二实体类别集合;
[0197] 将所述预设摘要中的第一词汇确定为所述模板内容,所述第一词汇的实体类别位于所述第一实体类别集合;
[0198] 删除所述预设摘要中的第二词汇,并将所述第二词汇所在位置的内容确定为所述待填充内容,所述第二词汇的实体类别位于所述第二实体类别集合。
[0199] 在一种可能的实现方式中,所述处理模块103还用于,在生成的所述第一对象的摘要的数量大于1时:
[0200] 基于所述至少两个摘要对应的摘要模板的权重值,展示所述第一对象的至少两个摘要;
[0201] 接收用户在所述至少两个摘要中选择的目标摘要;
[0202] 将所述目标摘要确定为所述第一对象的摘要。
[0203] 在一种可能的实现方式中,所述处理模块103还用于,将所述目标摘要确定为所述第一对象的摘要之后:
[0204] 根据所述目标摘要,更新所述至少两个摘要对应的摘要模板的权重值。
[0205] 本公开实施例提供的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
[0206] 图11为本公开实施例提供的电子设备的结构示意图,参考图11,其示出了适于用来实现本公开实施例的电子设备110的结构示意图,该电子设备110可以为终端设备或服务器。其中,终端设备可以包括但不限于诸如移动电话笔记本电脑、数字广播接收器、个人数字助理(Personal Digital Assistant,简称PDA)、平板电脑(Portable Android Device,简称PAD)、便携式多媒体播放器(Portable Media Player,简称PMP)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图11示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0207] 如图11所示,电子设备110可以包括处理装置(例如中央处理器、图形处理器等)111,其可以根据存储在只读存储器(Read Only Memory,简称ROM)112中的程序或者从存储装置118加载到随机访问存储器(Random Access Memory,简称RAM)113中的程序而执行各种适当的动作和处理。在RAM 113中,还存储有电子设备110操作所需的各种程序和数据。处理装置111、ROM 112以及RAM 113通过总线114彼此相连。输入/输出(I/O)接口115也连接至总线114。
[0208] 通常,以下装置可以连接至I/O接口115:包括例如触摸屏触摸板键盘鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置116;包括例如液晶显示器(Liquid Crystal Display,简称LCD)、扬声器、振动器等的输出装置117;包括例如磁带、硬盘等的存储装置118;以及通信装置119。通信装置119可以允许电子设备110与其他设备进行无线或有线通信以交换数据。虽然图11示出了具有各种装置的电子设备110,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
[0209] 特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置119从网络上被下载和安装,或者从存储装置118被安装,或者从ROM112被安装。在该计算机程序被处理装置111执行时,执行本公开实施例的摘要生成方法中限定的上述功能。
[0210] 需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
[0211] 上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
[0212] 上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
[0213] 可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(Local Area Network,简称LAN)或广域网(Wide Area Network,简称WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0214] 附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0215] 描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。
[0216] 最后应说明的是:以上各实施例仅用以说明本公开实施例的技术方案,而非对其限制;尽管参照前述各实施例对本公开实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开实施例方案的范围。
相关专利内容
标题 发布/更新时间 阅读量
摘要生成方法及装置 2020-05-11 33
摘要翻译器 2020-05-11 661
摘要生成装置和摘要生成方法 2020-05-11 371
摘要提取方法以及摘要提取模块 2020-05-11 595
摘要提取方法以及摘要提取模块 2020-05-11 722
处理消息摘要指令 2020-05-12 661
摘要生成方法和装置 2020-05-12 335
中文文件自动摘要方法 2020-05-13 566
会议摘要 2020-05-11 938
多功能摘要书籍 2020-05-11 632
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈