首页 / 专利库 / 专利权 / 第I章 / 国际申请 / 摘要 / 摘要生成方法及装置

摘要生成方法及装置

阅读:623发布:2020-05-12

专利汇可以提供摘要生成方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 提出一种 摘要 生成方法及装置,其中,该方法包括:通过采用预先训练的 深度神经网络 模型对接收到的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;采用文本排序 算法 对所述文本内容的各个句子进行打分,得到每个句子的第二得分;采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个目标句子;根据至少一个目标句子生成所述文本内容的摘要。从而实现了摘要内容的重要性和丰富性(去冗余)的最大化,较大程度地解决了摘要内容不通顺的问题。,下面是摘要生成方法及装置专利的具体信息内容。

1.一种摘要生成方法,其特征在于,包括:
采用预先训练的深度神经网络模型对接收到的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;
采用文本排序算法对所述文本内容的各个句子进行打分,得到每个句子的第二得分;
采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;
根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个目标句子;
根据至少一个目标句子生成所述文本内容的摘要。
2.如权利要求1所述的方法,其特征在于,所述根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个目标句子,包括:
采用至少一个次模函数处理每个句子的第三得分,得到与每个句子对应的至少一个处理后的第三得分;
对所述每个句子的至少一个处理后的第三得分进行加权求和,得到每个句子的目标得分;
根据所述贪心算法和每个句子的目标得分,从所述文本内容的各个句子中选出至少一个目标句子。
3.如权利要求1所述的方法,其特征在于,在所述采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分之前,还包括:
获取每个句子的位置特征和长度特征;
采用预先训练的第二逻辑回归模型处理每个句子的第二得分、位置特征和长度特征,以得到修正后的第二得分;
所述采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分,包括:
采用预先训练的第一逻辑回归模型处理每个句子的第一得分和修正后的第二得分。
4.如权利要求1所述的方法,其特征在于,还包括:
接收原始文本;
对所述原始文本进行预处理,得到所述接收到的文本内容,所述预处理包括以下处理方式中的至少一种:网页字符转义、全字符转半角、分段操作、分句操作、分词操作。
5.如权利要求4所述的方法,其特征在于,还包括:
对所述文本内容进行篇章结构分析;
确定所述文本内容的篇章结构不是对话类、图集类、列表类中的任一种。
6.如权利要求1所述的方法,其特征在于,在所述根据至少一个目标句子生成所述文本内容的摘要之后,还包括:
对所述摘要进行以下后处理方式中的至少一种:去印、去重归一、时效性分析。
7.如权利要求6所述的方法,其特征在于,所述对所述摘要进行时效性分析包括:
当摘要的类别为事件前时,设置摘要的失效时间为事件开始时间;
当摘要的类别为事件中时,设置摘要的失效时间为事件结束时间;
当摘要的类别为事件后时,设置摘要的失效时间为事件结束后经过预设时间段。
8.一种摘要生成装置,其特征在于,包括:
第一打分模,用于采用预先训练的深度神经网络模型对接收到的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;
第二打分模块,用于采用文本排序算法对所述文本内容的各个句子进行打分,得到每个句子的第二得分;
第三打分模块,用于采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;
选择模块,用于根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个目标句子;
生成模块,用于根据至少一个目标句子生成所述文本内容的摘要。
9.如权利要求8所述的装置,其特征在于,所述选择模块具体用于:
采用至少一个次模函数处理每个句子的第三得分,得到与每个句子对应的至少一个处理后的第三得分;
对所述每个句子的至少一个处理后的第三得分进行加权求和,得到每个句子的目标得分;
根据所述贪心算法和每个句子的目标得分,从所述文本内容的各个句子中选出至少一个目标句子。
10.如权利要求8所述的装置,其特征在于,还包括:
修正模块,用于在所述采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分之前,获取每个句子的位置特征和长度特征;采用预先训练的第二逻辑回归模型处理每个句子的第二得分、位置特征和长度特征,以得到修正后的第二得分;
所述第三打分模块具体用于:
采用预先训练的第一逻辑回归模型处理每个句子的第一得分和修正后的第二得分。
11.如权利要求8所述的装置,其特征在于,还包括:
接收模块,用于接收原始文本;
处理模块,用于对所述原始文本进行预处理,得到所述接收到的文本内容,所述预处理包括以下处理方式中的至少一种:网页字符转义、全角字符转半角、分段操作、分句操作、分词操作。
12.如权利要求11所述的装置,其特征在于,所述处理模块还用于:
对所述文本内容进行篇章结构分析;
确定所述文本内容的篇章结构不是对话类、图集类、列表类中的任一种。
13.如权利要求8所述的装置,其特征在于,所述处理模块还用于:
在所述根据至少一个目标句子生成所述文本内容的摘要之后,对所述摘要进行以下后处理方式中的至少一种:去水印、去重归一、时效性分析。
14.如权利要求13所述的装置,其特征在于,所述处理模块具体用于:
当摘要的类别为事件前时,设置摘要的失效时间为事件开始时间;
当摘要的类别为事件中时,设置摘要的失效时间为事件结束时间;
当摘要的类别为事件后时,设置摘要的失效时间为事件结束后经过预设时间段。
15.一种计算机设备,其特征在于,包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的摘要生成方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的摘要生成方法。
17.一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如权利要求1-7任一所述的摘要生成方法。

说明书全文

摘要生成方法及装置

技术领域

[0001] 本发明涉及自然语言处理领域,尤其涉及一种摘要生成方法及装置。

背景技术

[0002] 随着互联网技术的发展,用户可以接触到海量的文本信息,如新闻资讯、期刊论文、 网络日记、研究报告等,基于自动文本摘要技术从文本信息中提取文本摘要已成为用户快 速获取文本信息的一个高效的解决方案。
[0003] 目前,文本摘要技术分主要分为两类,一类为抽取式摘要技术,通过从原文中抽取跟 中心思想最接近的一条或几条句子组成摘要;另一类为,生成式摘要技术,通过将文本信 息输入到深度神经网络模型中,自动输出摘要。
[0004] 然而,抽取式摘要技术由于选择句子的过程相对独立,甚至引入去冗余机制以选择语 义不相关的句子,当两个句子之间不相关或缺少连接词时组合在一起就会出现不通顺现象。 生成式摘要技术使用深度神经网络模型自动生成一段话,但无法保证生成话术的通顺性, 不仅是多个句子组合不通顺,甚至在一个句子内部多个词的组合也可能是不通顺的。因此, 如何解决摘要内容不通顺的问题成为亟待解决的技术问题。

发明内容

[0005] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006] 为此,本发明的第一个目的在于提出一种摘要生成方法。
[0007] 本发明的第二个目的在于提出一种摘要生成装置。
[0008] 本发明的第三个目的在于提出另一种摘要生成装置。
[0009] 本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
[0010] 本发明的第五个目的在于提出一种计算机程序产品。
[0011] 为达上述目的,本发明第一方面实施例提出了一种摘要生成方法,包括:
[0012] 采用预先训练的深度神经网络模型对接收到的所述文本内容中的各个句子进行打分, 得到每个句子的第一得分;
[0013] 采用文本排序算法对所述文本内容的各个句子进行打分,得到每个句子的第二得分;
[0014] 采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分,得到每个句 子的第三得分;
[0015] 根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句 子中选出至少一个目标句子;
[0016] 根据至少一个目标句子生成所述文本内容的摘要。
[0017] 进一步地,所述根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文 本内容的各个句子中选出至少一个目标句子,包括:
[0018] 采用至少一个次模函数处理每个句子的第三得分,得到与每个句子对应的至少一个处 理后的第三得分;
[0019] 对所述每个句子的至少一个处理后的第三得分进行加权求和,得到每个句子的目标得 分;
[0020] 根据所述贪心算法和每个句子的目标得分,从所述文本内容的各个句子中选出至少一 个目标句子。
[0021] 进一步地,在所述采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二 得分之前,还包括:
[0022] 获取每个句子的位置特征和长度特征;
[0023] 采用预先训练的第二逻辑回归模型处理每个句子的第二得分、位置特征和长度特征, 以得到修正后的第二得分;
[0024] 所述采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分,包括:
[0025] 采用预先训练的第一逻辑回归模型处理每个句子的第一得分和修正后的第二得分。
[0026] 进一步地,所述方法还包括:
[0027] 接收原始文本;
[0028] 对所述原始文本进行预处理,得到所述接收到的文本内容,所述预处理包括以下处理 方式中的至少一种:网页字符转义、全字符转半角、分段操作、分句操作、分词操作。
[0029] 进一步地,所述方法还包括:
[0030] 对所述文本内容进行篇章结构分析;
[0031] 确定所述文本内容的篇章结构不是对话类、图集类、列表类中的任一种。
[0032] 进一步地,在所述根据至少一个目标句子生成所述文本内容的摘要之后,还包括:
[0033] 对所述摘要进行以下后处理方式中的至少一种:去印、去重归一、时效性分析。
[0034] 进一步地,所述对所述摘要进行时效性分析包括:
[0035] 当摘要的类别为事件前时,设置摘要的失效时间为事件开始时间;
[0036] 当摘要的类别为事件中时,设置摘要的失效时间为事件结束时间;
[0037] 当摘要的类别为事件后时,设置摘要的失效时间为事件结束后经过预设时间段。
[0038] 本发明实施例提供的摘要生成方法,通过采用预先训练的深度神经网络模型对接收到 的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;采用文本排序算法对 所述文本内容的各个句子进行打分,得到每个句子的第二得分;采用预先训练的第一逻辑 回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;根据至少一个 次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个 目标句子;根据至少一个目标句子生成所述文本内容的摘要。从而实现了摘要内容的重要 性和丰富性(去冗余)的最大化,较大程度地解决了摘要内容不通顺的问题。当文本内容 的来源为新闻资讯时,通过向用户推荐新闻摘要的方式能提高用户获取信息的效率,为引 导用户对话提高内容基础。尤其当以语音播放的方式播放新闻时,更为通顺的摘要能帮助 提升用户体验。
[0039] 为达上述目的,本发明第二方面实施例提出了一种摘要生成装置,包括:
[0040] 第一打分模,用于采用预先训练的深度神经网络模型对接收到的所述文本内容中的 各个句子进行打分,得到每个句子的第一得分;
[0041] 第二打分模块,用于采用文本排序算法对所述文本内容的各个句子进行打分,得到每 个句子的第二得分;
[0042] 第三打分模块,用于采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第 二得分,得到每个句子的第三得分;
[0043] 选择模块,用于根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文 本内容的各个句子中选出至少一个目标句子;
[0044] 生成模块,用于根据至少一个目标句子生成所述文本内容的摘要。
[0045] 进一步地,所述选择模块具体用于:
[0046] 采用至少一个次模函数处理每个句子的第三得分,得到与每个句子对应的至少一个处 理后的第三得分;
[0047] 对所述每个句子的至少一个处理后的第三得分进行加权求和,得到每个句子的目标得 分;
[0048] 根据所述贪心算法和每个句子的目标得分,从所述文本内容的各个句子中选出至少一 个目标句子。
[0049] 进一步地,所述装置还包括:
[0050] 修正模块,用于在所述采用预先训练的第一逻辑回归模型处理每个句子的第一得分和 第二得分之前,获取每个句子的位置特征和长度特征;采用预先训练的第二逻辑回归模型 处理每个句子的第二得分、位置特征和长度特征,以得到修正后的第二得分;
[0051] 所述第三打分模块具体用于:
[0052] 采用预先训练的第一逻辑回归模型处理每个句子的第一得分和修正后的第二得分。
[0053] 进一步地,所述装置还包括:
[0054] 接收模块,用于接收原始文本;
[0055] 处理模块,用于对所述原始文本进行预处理,得到所述接收到的文本内容,所述预处 理包括以下处理方式中的至少一种:网页字符转义、全角字符转半角、分段操作、分句操 作、分词操作。
[0056] 进一步地,所述处理模块还用于:
[0057] 对所述文本内容进行篇章结构分析;
[0058] 确定所述文本内容的篇章结构不是对话类、图集类、列表类中的任一种。
[0059] 进一步地,所述处理模块还用于:
[0060] 在所述根据至少一个目标句子生成所述文本内容的摘要之后,对所述摘要进行以下后 处理方式中的至少一种:去水印、去重归一、时效性分析。
[0061] 进一步地,所述处理模块具体用于:
[0062] 当摘要的类别为事件前时,设置摘要的失效时间为事件开始时间;
[0063] 当摘要的类别为事件中时,设置摘要的失效时间为事件结束时间;
[0064] 当摘要的类别为事件后时,设置摘要的失效时间为事件结束后经过预设时间段。
[0065] 本发明实施例提供的摘要生成装置,通过采用预先训练的深度神经网络模型对接收到 的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;采用文本排序算法对 所述文本内容的各个句子进行打分,得到每个句子的第二得分;采用预先训练的第一逻辑 回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;根据至少一个 次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个 目标句子;根据至少一个目标句子生成所述文本内容的摘要。从而实现了摘要内容的重要 性和丰富性(去冗余)的最大化,较大程度地解决了摘要内容不通顺的问题。当文本内容 的来源为新闻资讯时,通过向用户推荐新闻摘要的方式能提高用户获取信息的效率,为引 导用户对话提高内容基础。尤其当以语音播放的方式播放新闻时,更为通顺的摘要能帮助 提升用户体验。
[0066] 为达上述目的,本发明第三方面实施例提出了另一种摘要生成装置,包括存储器、处 理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实 现如上所述的摘要生成方法。
[0067] 为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质, 当所述存储介质中的指令被处理器执行时,实现如上所述的摘要生成方法。
[0068] 为达上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程 序产品中的指令处理器执行时,实现如上所述的摘要生成方法。
[0069] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明 显,或通过本发明的实践了解到。附图说明
[0070] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显 和容易理解,其中:
[0071] 图1为本发明实施例提供的一种摘要生成方法的流程示意图;
[0072] 图2为本发明实施例提供的又一种摘要生成方法的流程示意图;
[0073] 图3为本发明实施例提供的一种摘要生成装置的结构示意图;
[0074] 图4为本发明实施例提供的另一种摘要生成装置的结构示意图。

具体实施方式

[0075] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同 或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描 述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0076] 下面参考附图描述本发明实施例的摘要生成方法及装置。
[0077] 图1为本发明实施例提供的一种摘要生成方法的流程示意图。本实施例提供了一种摘 要生成方法,其执行主体为摘要生成方法装置,该执行主体由硬件和/或软件组成。
[0078] 如图1所示,该摘要生成方法,包括以下步骤:
[0079] S101、采用预先训练的深度神经网络模型对接收到的所述文本内容中的各个句子进行 打分,得到每个句子的第一得分。
[0080] 本实施例中,接收到的文本内容为预处理后的原始文本。具体地,先接收原始文本, 对原始文本进行预处理,得到接收到的文本内容;其中,预处理例如为文本归一化,文本 归一化包括网页字符转义、全角字符转半角、分段操作、分句操作、分词操作,但并不以 此为限。
[0081] 其中,原始文本可以是新闻类文本、论文类文本、对话类文本、图集类文本、列表类 文本,但并不以此为限。由于对话类文本、图集类文本、列表类文本等文本不适合生成摘 要,因此,对文本内容进行篇章结构分析,当文本内容的篇章结构是对话类、图集类、列 表类中的任一种时,不再执行抽取该文本内容的摘要的步骤;若当文本内容的篇章结构不 是对话类、图集类、列表类中的任一种,执行抽取该文本内容的摘要的步骤。
[0082] 其中,可以通过段落解析方法、图片解析方法、小标题识别方法等对文本内容进行篇 章结构分析,识别文本内容的篇章结构是否为对话类、图集类、列表类、多事件聚合类, 但并不限于此。其中,可以从多事件聚合类的文本内容中抽取摘要。
[0083] 本实施例中,深度神经网络模型是提前训练好的,该深度神经网络模型用来对句子进 行打分。其中,深度神经网络模型给出的句子的得分与句子在文本内容中的重要程度相关, 句子在文本内容中越重要,深度神经网络模型给出的得分越高。
[0084] 作为一种示例,将文本内容输入到深度神经网络模型中后,深度神经网络模型先使用 预先训练的词向量词典对文本内容的各个分词进行映射,得到该文本内容的各个词向量 Word Embedding;接着采用双向GRNN(General Regression Neural Network,广义回归神经 网络)模型处理各个词向量Word Embedding,得到该文本内容的各个句向量Sentence Embedding;取GRNN的输出,或者对各个句向量Sentence Embedding进行池化操作,得 到该文本内容的文本向量Document Embedding,其中,池化操作可以是以下操作中的任一 种:平均池化操作、最大池化操作、重叠池化操作;最后,计算该文本内容的文本向量 Document Embedding与各个句向量Sentence Embedding之间的attention,得到各个句子的 第一得分。
[0085] S102、采用文本排序算法对所述文本内容的各个句子进行打分,得到每个句子的第二 得分。
[0086] 本实施例中,文本排序算法例如为TextRank算法,TextRank算法是自然语言处理领域 一种比较常见的关键词提取算法,可用于提取关键词、短语和自动生成文本摘要等。
[0087] 本实施例中,采用文本排序算法可以识别各个句子在文本内容中的重要程度,并根据 重要程度对各个句子进行打分,句子在文本内容中越重要,给出的第二得分越高。
[0088] S103、采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分,得到 每个句子的第三得分。
[0089] 本实施例中,第一逻辑回归模型是通过训练逻辑回归(Logistic Regression,LR)算法得到 的,训练好的第一逻辑回归模型能够根据句子的第一得分和第二得分预测该句子的第三得 分。
[0090] 进一步地,在采用第一逻辑回归模型对每个句子打分之前,还可以对文本排序算法给 出的句子的第二得分进行修正,第一逻辑回归模型处理每个句子的第一得分和修正后的第 二得分以对每个句子的打分。
[0091] 本实施例中,“对文本排序算法给出的句子的第二得分进行修正”的具体实现方式为: 获取每个句子的位置特征和长度特征;采用预先训练的第二逻辑回归模型处理每个句子的 第二得分、位置特征和长度特征,以得到修正后的第二得分。
[0092] 本实施例中,第二逻辑回归模型是通过训练逻辑回归(Logistic Regression,LR)算法得到 的,训练好的第二逻辑回归模型能够根据句子的第二得分、位置特征和长度特征修正该句 子的第二得分。
[0093] S104、根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文本内容的 各个句子中选出至少一个目标句子。
[0094] 本实施例中,先采用至少一个次模函数处理每个句子的第三得分,得到每个句子的处 理结果,再通过贪心算法对各个句子的处理结果进行分析,实现从文本内容的各个句子中 选出至少一个目标句子。
[0095] 具体地,次模函数(submodular function)又称“子模函数”或“亚模函数”,次模函 数具有次模性(submodularity),它是经济学上边际效益递减(property of diminishing returns) 现象的形式化描述。当目标函数是次模函数时,许多组合优化问题能够在多项式时间内得 到最优解或近似解。贪心算法是指所求问题的整体最优解可以通过一系列局部最优的选择, 即贪心选择来达到。
[0096] 本实施例中,从文本内容中抽取部分句子组合成摘要是个很典型的组合优化问题,因 此,基于次模函数和贪心算法从文本内容中挑选组合摘要的句子,可以实现摘要内容的重 要性和丰富性(去冗余)的最大化。
[0097] 具体地,可以设计多个次模函数,一个次模函数可以理解为一个维度的摘要生成问题 的建模,多个次模函数可以理解为多个维度的摘要生成问题的建模,从多维度进行建模可 以进一步地优化摘要生成问题。
[0098] S105、根据至少一个目标句子生成所述文本内容的摘要。
[0099] 本实施例中,目标句子可以理解为从文本内容的各个句子中择优选择出的句子,基于 目标句子组成的摘要为最优的摘要。
[0100] 进一步地,在生成摘要之后,还可以对摘要进行以下后处理方式中的至少一种:去水 印、去重归一、时效性分析,但并不以此为限。
[0101] 需要指出的是,由于原始文本中有些句子难免出现带有水印的情况,因此,对摘要进 行去水印处理,能够提高摘要内容的信息纯度。例如,可以使用词典和模版的方法去除摘 要中的句子所包括的站点、记者、广告等水印。
[0102] 需要指出的是,当原始文本为新闻类文本,由于同一事件可能会对应多篇新闻报道, 导致从中提取出的事件摘要在字面或语义上高度相似,需要对这类摘要进行去重归一。具 体地,先通过事件要素对摘要进行聚类,将同一事件的摘要聚为一类,然后计算类内摘要 之间的相似度,对相似度超过阈值的摘要进行过滤。
[0103] 需要指出的是,当原始文本为新闻类文本,由于新闻事件具有很强的时效性,因此基 于新闻事件的新闻摘要对时效性有较高的要求。以足球比赛的新闻为例,赛前预测的新闻 在比赛开始后失效,赛中报道的新闻在比赛结束时失效,球队积分榜的新闻在该球队的下 一场比赛结束时失效。
[0104] 因此,本实施例需要对新闻摘要进行时效性分析。具体地,从新闻摘要中识别新闻事 件,基于新闻发布时间结合新闻事件的先验知识为摘要设置失效时间。例如,可以将摘要 的类别分为事件前、事件中、事件后三种,设置失效时间为事件开始时间、事件结束时间、 事件结束后经过预设时间段,预设时间段根据实现情形设置,预设时间段例如为24小时。 具体地,当摘要的类别为事件前时,设置摘要的失效时间为事件开始时间;当摘要的类别 为事件中时,设置摘要的失效时间为事件结束时间;当摘要的类别为事件后时,设置摘要 的失效时间为事件结束后经过预设时间段。
[0105] 本发明实施例提供的摘要生成方法,通过采用预先训练的深度神经网络模型对接收到 的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;采用文本排序算法对 所述文本内容的各个句子进行打分,得到每个句子的第二得分;采用预先训练的第一逻辑 回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;根据至少一个 次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个 目标句子;根据至少一个目标句子生成所述文本内容的摘要。从而实现了摘要内容的重要 性和丰富性(去冗余)的最大化,较大程度地解决了摘要内容不通顺的问题。当文本内容 的来源为新闻资讯时,通过向用户推荐新闻摘要的方式能提高用户获取信息的效率,为引 导用户对话提高内容基础。尤其当以语音播放的方式播放新闻时,更为通顺的摘要能帮助 提升用户体验。
[0106] 图2为本发明实施例提供的又一种摘要生成方法的流程示意图。结合参考图2,在图1 所示的实施例的基础上,步骤S104的具体实现方式为:
[0107] S1041、采用至少一个次模函数处理每个句子的第三得分,得到与每个句子对应的至少 一个处理后的第三得分。
[0108] S1042、对所述每个句子的至少一个处理后的第三得分进行加权求和,得到每个句子的 目标得分。
[0109] 本实施例中,次模函数的个数和具体形式根据实际情形进行设置。例如,至少一个次 模函数分别为f1(S)、f2(S)、f3(S)......…..等N个次模函数,其中,N为正整数;将句子的 第三得分输入到这N个次模函数中,根据公式(1)对N个次模函数的输出进行线性组合, 作为该句子的目标得分F(S)。
[0110]
[0111] 其中,i为1至N中的任一正整数,ωi为fi(S)的权重系数,该权重系数可以通过有监 督模型训练得到。
[0112] S1043、根据所述贪心算法和每个句子的目标得分,从所述文本内容的各个句子中选出 至少一个目标句子。
[0113] 本实施例中,根据实际情形设计贪心算法的贪心策略,例如,贪心策略为次挑选出的 目标得分大于设定阈值的句子,则选择的目标句子均为大于设定阈值的句子。
[0114] 进一步地,为平衡摘要内容的去冗余度与相关性,贪心算法使用公式(2)所示的目标 函数。
[0115]
[0116] 其中,S为已抽取的句子集合,k为预备抽取的句子,F为公式(1)表示的函数,Dkj表示句子k和句子j的相似性。
[0117] 本发明实施例提供的摘要生成方法,通过采用预先训练的深度神经网络模型对接收到 的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;采用文本排序算法对 所述文本内容的各个句子进行打分,得到每个句子的第二得分;采用预先训练的第一逻辑 回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;根据至少一个 次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个 目标句子;根据至少一个目标句子生成所述文本内容的摘要。从而实现了摘要内容的重要 性和丰富性(去冗余)的最大化,较大程度地解决了摘要内容不通顺的问题。当文本内容 的来源为新闻资讯时,通过向用户推荐新闻摘要的方式能提高用户获取信息的效率,为引 导用户对话提高内容基础。尤其当以语音播放的方式播放新闻时,更为通顺的摘要能帮助 提升用户体验。
[0118] 图3为本发明实施例提供的一种摘要生成装置的结构示意图。本实施例提供了一种摘 要生成装置,该装置是摘要生成方法的执行主体,该执行主体由硬件和/或软件组成。如图 3所示,该摘要生成装置包括:第一打分模块11、第二打分模块12、第三打分模块13、选 择模块14、生成模块15。
[0119] 第一打分模块11,用于采用预先训练的深度神经网络模型对接收到的所述文本内容中 的各个句子进行打分,得到每个句子的第一得分;
[0120] 第二打分模块12,用于采用文本排序算法对所述文本内容的各个句子进行打分,得到 每个句子的第二得分;
[0121] 第三打分模块13,用于采用预先训练的第一逻辑回归模型处理每个句子的第一得分和 第二得分,得到每个句子的第三得分;
[0122] 选择模块14,用于根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述 文本内容的各个句子中选出至少一个目标句子;
[0123] 生成模块15,用于根据至少一个目标句子生成所述文本内容的摘要。
[0124] 进一步地,所述选择模块14具体用于:
[0125] 采用至少一个次模函数处理每个句子的第三得分,得到与每个句子对应的至少一个处 理后的第三得分;
[0126] 对所述每个句子的至少一个处理后的第三得分进行加权求和,得到每个句子的目标得 分;
[0127] 根据所述贪心算法和每个句子的目标得分,从所述文本内容的各个句子中选出至少一 个目标句子。
[0128] 进一步地,所述装置还包括:
[0129] 修正模块,用于在所述采用预先训练的第一逻辑回归模型处理每个句子的第一得分和 第二得分之前,获取每个句子的位置特征和长度特征;采用预先训练的第二逻辑回归模型 处理每个句子的第二得分、位置特征和长度特征,以得到修正后的第二得分;
[0130] 所述第三打分模块13具体用于:
[0131] 采用预先训练的第一逻辑回归模型处理每个句子的第一得分和修正后的第二得分。
[0132] 进一步地,所述装置还包括:
[0133] 接收模块,用于接收原始文本;
[0134] 处理模块,用于对所述原始文本进行预处理,得到所述接收到的文本内容,所述预处 理包括以下处理方式中的至少一种:网页字符转义、全角字符转半角、分段操作、分句操 作、分词操作。
[0135] 进一步地,所述处理模块还用于:
[0136] 对所述文本内容进行篇章结构分析;
[0137] 确定所述文本内容的篇章结构不是对话类、图集类、列表类中的任一种。
[0138] 进一步地,所述处理模块还用于:
[0139] 在所述根据至少一个目标句子生成所述文本内容的摘要之后,对所述摘要进行以下后 处理方式中的至少一种:去水印、去重归一、时效性分析。
[0140] 进一步地,所述处理模块具体用于:
[0141] 当摘要的类别为事件前时,设置摘要的失效时间为事件开始时间;
[0142] 当摘要的类别为事件中时,设置摘要的失效时间为事件结束时间;
[0143] 当摘要的类别为事件后时,设置摘要的失效时间为事件结束后经过预设时间段。
[0144] 需要说明的是,前述对摘要生成方法实施例的解释说明也适用于该实施例的摘要生成 装置,此处不再赘述。
[0145] 本发明实施例提供的摘要生成装置,通过采用预先训练的深度神经网络模型对接收到 的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;采用文本排序算法对 所述文本内容的各个句子进行打分,得到每个句子的第二得分;采用预先训练的第一逻辑 回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;根据至少一个 次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个 目标句子;根据至少一个目标句子生成所述文本内容的摘要。从而实现了摘要内容的重要 性和丰富性(去冗余)的最大化,较大程度地解决了摘要内容不通顺的问题。当文本内容 的来源为新闻资讯时,通过向用户推荐新闻摘要的方式能提高用户获取信息的效率,为引 导用户对话提高内容基础。尤其当以语音播放的方式播放新闻时,更为通顺的摘要能帮助 提升用户体验。
[0146] 图4为本发明实施例提供的另一种摘要生成装置的结构示意图。该摘要生成装置包括:
[0147] 存储器1001、处理器1002及存储在存储器1001上并可在处理器1002上运行的计算 机程序。
[0148] 处理器1002执行所述程序时实现上述实施例中提供的摘要生成方法。
[0149] 进一步地,摘要生成装置还包括:
[0150] 通信接口1003,用于存储器1001和处理器1002之间的通信。
[0151] 存储器1001,用于存放可在处理器1002上运行的计算机程序。
[0152] 存储器1001可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
[0153] 处理器1002,用于执行所述程序时实现上述实施例所述的摘要生成方法。
[0154] 如果存储器1001、处理器1002和通信接口1003独立实现,则通信接口1003、存储器 1001和处理器1002可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标 准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称为EISA)总线等。所述总线可以分为地址总线数据总线、控制总线等。 为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0155] 可选的,在具体实现上,如果存储器1001、处理器1002及通信接口1003,集成在一 块芯片上实现,则存储器1001、处理器1002及通信接口1003可以通过内部接口完成相互 间的通信。
[0156] 处理器1002可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是 特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实 施本发明实施例的一个或多个集成电路。
[0157] 本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该 程序被处理器执行时实现如上所述的摘要生成方法。
[0158] 本实施例还提供一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时, 如上所述的摘要生成方法。
[0159] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、 或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包 含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须 针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一 个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技 术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合 和组合。
[0160] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或 者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者 隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个, 三个等,除非另有明确具体的限定。
[0161] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个 或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分, 并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序, 包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的 实施例所属技术领域的技术人员所理解。
[0162] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实 现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令 执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行 系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设 备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播 或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用 的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布 线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM), 只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置, 以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印 所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着 进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其 存储在计算机存储器中。
[0163] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实 施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或 固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技 术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑电路的离 散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场 可编程门阵列(FPGA)等。
[0164] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可 以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中, 该程序在执行时,包括方法实施例的步骤之一或其组合。
[0165] 此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各 个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既 可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以 软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读 取存储介质中。
[0166] 上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了 本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制, 本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
相关专利内容
标题 发布/更新时间 阅读量
摘要生成方法及装置 2020-05-11 33
摘要翻译器 2020-05-11 661
摘要生成装置和摘要生成方法 2020-05-11 371
摘要提取方法以及摘要提取模块 2020-05-11 595
摘要提取方法以及摘要提取模块 2020-05-11 722
处理消息摘要指令 2020-05-12 661
摘要生成方法和装置 2020-05-12 335
中文文件自动摘要方法 2020-05-13 566
会议摘要 2020-05-11 938
多功能摘要书籍 2020-05-11 632
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈