摘要生成方法、装置、设备及介质专利检索-摘要国际申请申请专利权专利检索查询-专利查询网

摘要生成方法、装置、设备及介质

阅读：1028发布：2020-05-20

专利汇可以提供摘要生成方法、装置、设备及介质专利检索，专利查询，专利分析的服务。并且本公开提供了一种摘要生成方法、装置、设备及介质，属于网络技术领域。本公开根据会议文本信息中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，确定每个文本片段的权重，生成目标摘要，由于会议中不同的发言人发言的重要性不同，相比于只根据会议文本信息中任两个句子的相似度确定每个句子的权重，增加了发言人的身份权重因素，使得到的每个文本片段的权重更准确，进而生成的目标摘要也更准确，提高了目标摘要的准确率。，下面是摘要生成方法、装置、设备及介质专利的具体信息内容。

权利要求

1.一种摘要生成方法，其特征在于，所述方法包括：
基于第一会议文本信息中多个文本片段和所述多个文本片段中每个文本片段的发言人信息，获取所述多个文本片段中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重；
基于所述任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，获取每个文本片段的权重；
基于所述第一会议文本信息中所述权重符合目标条件的文本片段，生成目标摘要。
2.根据权利要求1所述的方法，其特征在于，所述基于所述任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，获取每个文本片段的权重，包括：
对于任一文本片段，基于与所述任一文本片段的相似度大于相似度阈值的文本片段集合中每个文本片段的所述权重，所述文本片段集合中每个文本片段与其他的文本片段的相似度，以及所述任一文本片段的发言人对应的身份权重，获取所述任一文本片段的权重。
3.根据权利要求1所述的方法，其特征在于，所述每个文本片段的发言人对应的身份权重的获取过程包括下述任一项：
对于每个发言人，获取预设的所述发言人对应的第一身份权重作为所述发言人对应的身份权重；
对于每个发言人，基于所述发言人的身份信息，获取预设的所述身份信息对应的第二身份权重作为所述发言人对应的身份权重；
对于每个发言人，基于所述第一会议文本信息中目标时间之前的第二会议文本信息，对所述发言人对应的第一身份权重或所述发言人的身份信息对应的第二身份权重进行更新，将更新后的第三身份权重作为所述发言人对应的身份权重。
4.根据权利要求3所述的方法，其特征在于，所述基于所述第一会议文本信息中目标时间之前的第二会议文本信息，对所述发言人对应的第一身份权重或所述发言人的身份信息对应的第二身份权重进行更新，包括下述任一项：
对于每个发言人，基于所述第二会议文本信息，提取所述发言人的多个文本片段对应的第一摘要和所述第二会议文本信息中所有文本片段对应的第二摘要，根据所述第一摘要和所述第二摘要的相似度，对所述第一身份权重或所述第二身份权重进行更新；
对于每个发言人，基于所述第二会议文本信息，根据所述发言人的多个文本片段和所述第二会议文本信息中所有文本片段的相似度，对所述第一身份权重或所述第二身份权重进行更新。
5.根据权利要求3所述的方法，其特征在于，所述文本片段为句子；
所述基于所述第一会议文本信息中目标时间之前的第二会议文本信息，对所述发言人对应的第一身份权重或所述发言人的身份信息对应的第二身份权重进行更新，包括：
对于每个发言人，从所述第二会议文本信息中，提取所述发言人的多个句子的关键词，得到第一关键词集合，基于所述第二会议文本信息中所有句子，获取第二关键词集合，根据所述第一关键词集合和所述第二关键词集合的相似度，对所述第一身份权重或所述第二身份权重进行更新。
6.根据权利要求5述的方法，其特征在于，所述从所述第二会议文本信息中，提取所述发言人的多个句子的关键词，得到第一关键词集合，包括：
基于所述发言人的身份信息、所述发言人对应的第一身份权重或所述发言人的身份信息对应的第二身份权重中的任一项，获取所述发言人对应的关键词数量；
基于所述关键词数量，提取所述发言人的多个句子的关键词，得到所述第一关键词集合。
7.根据权利要求1所述的方法，其特征在于，所述基于所述第一会议文本信息中所述权重符合目标条件的文本片段，生成目标摘要，包括下述任一项：
基于所述第一会议文本信息中所述权重大于目标阈值的文本片段，生成目标摘要；
获取所述第一会议文本信息中所述权重大于所述目标阈值的文本片段为候选文本片段，基于所述候选文本片段中权重最大的目标比例的文本片段，生成目标摘要；
获取所述第一会议文本信息中所述权重大于所述目标阈值的文本片段为候选文本片段，基于所述候选文本片段中权重最大的目标数量的文本片段，生成目标摘要，所述目标数量基于所述第一会议文本信息中所述权重大于所述权重阈值的文本片段的数量确定。
8.一种摘要生成装置，其特征在于，所述装置包括多个功能模块，所述多个功能模块用于执行权利要求1至权利要求7任一项所述的摘要生成方法。
9.一种计算机设备，其特征在于，所述计算机设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条指令，所述指令由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求7任一项所述的摘要生成方法所执行的操作。
10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的摘要生成方法所执行的操作。

说明书全文

摘要生成方法、装置、设备及介质

技术领域

[0001] 本公开涉及网络技术领域，特别涉及一种摘要生成方法、装置、设备及介质。

背景技术

[0002] 近年来，随着智能语音技术的发展，出现了一系列的智能会议系统，能够将会议内容通过语音识别生成对应的会议文本信息，对会议文本信息进行记录和存储，还可以基于该会议文本信息自动生成摘要，会议中使用者无需再慌乱的打字记录，只需要收录音频，进行自动识别和生成摘要即可。

[0003] 在相关技术中，具体的生成摘要的方法可以为:通过语音识别生成会议对应的会议文本信息，使用文字排名(TextRank)算法，根据会议文本信息中任两个句子之间的相似度来获得每个句子的权重，根据句子权重生成目标摘要。

[0004] 在上述生成摘要的方法中，生成摘要时仅依据会议文本信息中任两个句子之间的相似度来生成摘要，但在真实的会议场景中，影响一句话是否是会议摘要的因素有很多，基于上述方法，生成的摘要准确率低，与实际情况不符。发明内容

[0005] 本公开实施例提供了一种摘要生成方法、装置、设备及介质，可以解决相关技术中仅依据会议文本信息中任两个句子之间的相似度来生成摘要，生成的摘要准确率低的问题。所述技术方案如下：

[0006] 一方面，提供了一种摘要生成方法，该方法包括：

[0007] 基于第一会议文本信息中多个文本片段和该多个文本片段中每个文本片段的发言人信息，获取该多个文本片段中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重；

[0008] 基于该任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，获取每个文本片段的权重；

[0009] 基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要。

[0010] 在一种可能实现方式中，该基于该任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，获取每个文本片段的权重，包括：

[0011] 对于任一文本片段，基于与该任一文本片段的相似度大于相似度阈值的文本片段集合中每个文本片段的该权重，该文本片段集合中每个文本片段与其他的文本片段的相似度，以及该任一文本片段的发言人对应的身份权重，获取该任一文本片段的权重。

[0012] 在一种可能实现方式中，该每个文本片段的发言人对应的身份权重的获取过程包括下述任一项：

[0013] 对于每个发言人，获取预设的该发言人对应的第一身份权重作为该发言人对应的身份权重；

[0014] 对于每个发言人，基于该发言人的身份信息，获取预设的该身份信息对应的第二身份权重作为该发言人对应的身份权重；

[0015] 对于每个发言人，基于该第一会议文本信息中目标时间之前的第二会议文本信息，对该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重进行更新，将更新后的第三身份权重作为该发言人对应的身份权重。

[0016] 在一种可能实现方式中，所述基于该第一会议文本信息中目标时间之前的第二会议文本信息，对该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重进行更新，包括下述任一项：

[0017] 对于每个发言人，基于该第二会议文本信息，提取该发言人的多个文本片段对应的第一摘要和该第二会议文本信息中所有文本片段对应的第二摘要，根据该第一摘要和该第二摘要的相似度，对该第一身份权重或该第二身份权重进行更新；

[0018] 对于每个发言人，基于该第二会议文本信息，根据该发言人的多个文本片段和该第二会议文本信息中所有文本片段的相似度，对该第一身份权重或该第二身份权重进行更新。

[0019] 在一种可能实现方式中，该文本片段为句子；

[0020] 该基于该第一会议文本信息中目标时间之前的第二会议文本信息，对该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重进行更新，包括：

[0021] 对于每个发言人，从该第二会议文本信息中，提取该发言人的多个句子的关键词，得到第一关键词集合，基于该第二会议文本信息中所有句子，获取第二关键词集合，根据该第一关键词集合和该第二关键词集合的相似度，对该第一身份权重或该第二身份权重进行更新。

[0022] 在一种可能实现方式中，所述从该第二会议文本信息中，提取该发言人的多个句子的关键词，得到第一关键词集合，包括：

[0023] 基于该发言人的身份信息、该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重中的任一项，获取该发言人对应的关键词数量；

[0024] 基于该关键词数量，提取该发言人的多个句子的关键词，得到该第一关键词集合。

[0025] 在一种可能实现方式中，所述基于该第二会议文本信息中所有句子，获取第二关键词集合，包括下述任一项：

[0026] 提取该第二会议文本信息中所有句子的关键词，得到该第二关键词集合；

[0027] 提取该第二会议文本信息中所有句子的关键词，将该第二会议文本信息中所有句子的关键词和预设的关键词的集合作为该第二关键词集合。

[0028] 在一种可能实现方式中，

[0029] 该文本片段为句子；

[0030] 所述基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要，包括：

[0031] 基于该第一会议文本信息中该权重符合目标条件的句子，按照时间顺序进行拼接，生成目标摘要；或，

[0032] 该文本片段为关键词；

[0033] 所述基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要，包括：

[0034] 基于该第一会议文本信息中该权重符合目标条件的关键词，以及自然语言生成规则，生成目标摘要。

[0035] 在一种可能实现方式中，所述基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要，包括下述任一项：

[0036] 基于该第一会议文本信息中该权重大于目标阈值的文本片段，生成目标摘要；

[0037] 基于该第一会议文本信息中该权重大于该目标阈值的目标比例的文本片段，生成目标摘要；

[0038] 基于该第一会议文本信息中该权重大于该目标阈值的目标数量的文本片段，生成目标摘要，该目标数量基于该第一会议文本信息中该权重大于该权重阈值的文本片段的数量确定。

[0039] 在一种可能实现方式中，所述基于第一会议文本信息中多个文本片段和每个文本片段的发言人信息，获取该多个文本片段中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重之前，该方法还包括：

[0040] 对会议中的语音信息进行语音识别，得到该第一会议文本信息中的该多个文本片段；

[0041] 对会议中的语音信息进行声纹识别，得到该第一会议文本信息中每个文本片段的该发言人信息。

[0042] 在一种可能实现方式中，该方法还包括：

[0043] 对实时获取的会议中的语音信息进行语音识别，得到第三会议文本信息中的多个文本片段；

[0044] 对实时获取的会议中的语音信息进行声纹识别，得到第三会议文本信息中每个文本片段的该发言人信息；

[0045] 获取预设周期内的多个第三会议文本信息作为该第一会议文本信息。

[0046] 在一种可能实现方式中，所述获取预设周期内的该第三会议文本信息作为该第一会议文本信息之后，该方法还包括：

[0047] 根据该第一会议文本信息中每个文本片段的该发言人信息，对每个文本片段进行分类存储。

[0048] 在一种可能实现方式中，所述获取预设周期内的该第三会议文本信息作为该第一会议文本信息之后，该方法还包括：

[0049] 在终端界面显示该第一会议文本信息；

[0050] 基于用户的第一修改指令，对该第一会议文本信息进行修正。

[0051] 在一种可能实现方式中，所述基于用户的第一修改指令，对该第三会议文本信息进行修正之后，该方法还包括：

[0052] 对该第一修改指令所指示的文本片段以及对该文本片段的修改方式进行存储；

[0053] 当该第一会议文本信息中任一文本片段与存储的该文本片段匹配时，基于该文本片段的修改方式，对该任一文本片段进行修正。

[0054] 在一种可能实现方式中，所述基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要之后，该方法还包括：

[0055] 在终端界面显示该目标摘要；

[0056] 基于用户的第二修改指令，对该目标摘要进行修正。

[0057] 一方面，提供了一种摘要生成装置，该装置包括：

[0058] 获取模块，用于基于第一会议文本信息中多个文本片段和该多个文本片段中每个文本片段的发言人信息，获取该多个文本片段中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重；

[0059] 该获取模块还用于基于该任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，获取每个文本片段的权重；

[0060] 生成模块，用于基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要。

[0061] 在一种可能实现方式中，该获取模块还用于：

[0062] 对于任一文本片段，基于与该任一文本片段的相似度大于相似度阈值的文本片段集合中每个文本片段的该权重，该文本片段集合中每个文本片段与其他的文本片段的相似度，以及该任一文本片段的发言人对应的身份权重，获取该任一文本片段的权重。

[0063] 在一种可能实现方式中，该获取模块还用于执行下述任一项：

[0064] 对于每个发言人，获取预设的该发言人对应的第一身份权重作为该发言人对应的身份权重；

[0065] 对于每个发言人，基于该发言人的身份信息，获取预设的该身份信息对应的第二身份权重作为该发言人对应的身份权重；

[0066] 对于每个发言人，基于该第一会议文本信息中目标时间之前的第二会议文本信息，对该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重进行更新，将更新后的第三身份权重作为该发言人对应的身份权重。

[0067] 在一种可能实现方式中，该装置还包括：

[0068] 更新模块，用于执行下述任一项：

[0069] 对于每个发言人，基于该第二会议文本信息，提取该发言人的多个文本片段对应的第一摘要和该第二会议文本信息中所有文本片段对应的第二摘要，根据该第一摘要和该第二摘要的相似度，对该第一身份权重或该第二身份权重进行更新；

[0070] 对于每个发言人，基于该第二会议文本信息，根据该发言人的多个文本片段和该第二会议文本信息中所有文本片段的相似度，对该第一身份权重或该第二身份权重进行更新。

[0071] 在一种可能实现方式中，该文本片段为句子；

[0072] 该更新模块还用于对于每个发言人，从该第二会议文本信息中，提取该发言人的多个句子的关键词，得到第一关键词集合，基于该第二会议文本信息中所有句子，获取第二关键词集合，根据该第一关键词集合和该第二关键词集合的相似度，对该第一身份权重或该第二身份权重进行更新。

[0073] 在一种可能实现方式中，该装置还包括提取模块，用于：

[0074] 基于该发言人的身份信息、该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重中的任一项，获取该发言人对应的关键词数量；

[0075] 基于该关键词数量，提取该发言人的多个句子的关键词，得到该第一关键词集合。

[0076] 在一种可能实现方式中，该获取模块还用于执行下述任一项：

[0077] 提取该第二会议文本信息中所有句子的关键词，得到该第二关键词集合；

[0078] 提取该第二会议文本信息中所有句子的关键词，将该第二会议文本信息中所有句子的关键词和预设的关键词的集合作为该第二关键词集合。

[0079] 在一种可能实现方式中，

[0080] 该文本片段为句子；

[0081] 该生成模块还用于基于该第一会议文本信息中该权重符合目标条件的句子，按照时间顺序进行拼接，生成目标摘要；或，

[0082] 该文本片段为关键词；

[0083] 该生成模块还用于基于该第一会议文本信息中该权重符合目标条件的关键词，以及自然语言生成规则，生成目标摘要。

[0084] 在一种可能实现方式中，该生成模块还用于执行下述任一项：

[0085] 基于该第一会议文本信息中该权重大于目标阈值的文本片段，生成目标摘要；

[0086] 获取该第一会议文本信息中该权重大于该目标阈值的文本片段为候选文本片段，基于该候选文本片段中权重最大的目标比例的文本片段，生成目标摘要；

[0087] 获取该第一会议文本信息中该权重大于该目标阈值的文本片段为候选文本片段，基于该候选文本片段中权重最大的目标数量的文本片段，生成目标摘要，该目标数量基于该第一会议文本信息中该权重大于该权重阈值的文本片段的数量确定。

[0088] 在一种可能实现方式中，该装置还包括：

[0089] 语音识别模块，用于对会议中的语音信息进行语音识别，得到该第一会议文本信息中的该多个文本片段；

[0090] 声纹识别模块，用于对会议中的语音信息进行声纹识别，得到该第一会议文本信息中每个文本片段的该发言人信息。

[0091] 在一种可能实现方式中，

[0092] 该语音识别模块还用于对实时获取的会议中的语音信息进行语音识别，得到第三会议文本信息中的多个文本片段；

[0093] 该声纹识别模块还用于对实时获取的会议中的语音信息进行声纹识别，得到第三会议文本信息中每个文本片段的该发言人信息；

[0094] 该获取模块还用于获取预设周期内的多个第三会议文本信息作为该第一会议文本信息。

[0095] 在一种可能实现方式中，该装置还包括：

[0096] 存储模块，用于根据该第一会议文本信息中每个文本片段的该发言人信息，对每个文本片段进行分类存储。

[0097] 在一种可能实现方式中，该装置还包括：

[0098] 显示模块，用于在终端界面显示该第一会议文本信息；

[0099] 修正模块，用于基于用户的第一修改指令，对该第一会议文本信息进行修正。

[0100] 在一种可能实现方式中，

[0101] 该存储模块还用于对该第一修改指令所指示的文本片段以及对该文本片段的修改方式进行存储；

[0102] 该修正模块还用于当该第一会议文本信息中任一文本片段与存储的该文本片段匹配时，基于该文本片段的修改方式，对该任一文本片段进行修正。

[0103] 在一种可能实现方式中，

[0104] 该显示模块还用于在终端界面显示该目标摘要；

[0105] 该修正模块还用于基于用户的第二修改指令，对该目标摘要进行修正。

[0106] 一方面，提供了一种计算机设备，该计算机设备包括一个或多个处理器和一个或多个存储器，该一个或多个存储器中存储有至少一条指令，该指令由该一个或多个处理器加载并执行以实现该摘要生成方法所执行的操作。

[0107] 一方面，提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条指令，该指令由处理器加载并执行以实现该摘要生成方法所执行的操作。

[0108] 本公开实施例提供的技术方案带来的有益效果至少可以包括：

[0109] 本公开实施例提供的技术方案，根据会议文本信息中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，确定每个文本片段的权重，生成目标摘要，由于会议中不同的发言人发言的重要性不同，相比于只根据会议文本信息中任两个句子的相似度确定每个句子的权重，增加了发言人的身份权重因素，使得到的每个文本片段的权重更准确，进而生成的目标摘要也更准确，提高了目标摘要的准确率。附图说明

[0110] 为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0111] 图1是本公开实施例提供的一种摘要生成方法的实施环境示意图；

[0112] 图2是本公开实施例提供的一种摘要生成方法流程图；

[0113] 图3是本公开实施例提供的一种摘要生成方法流程图；

[0114] 图4是本公开实施例提供的一种摘要生成装置结构示意图；

[0115] 图5是本公开实施例提供的一种终端的结构示意图；

[0116] 图6是本公开实施例提供的一种服务器的结构示意图。

具体实施方式

[0117] 为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。

[0118] 图1是本公开实施例提供的一种摘要生成方法的实施环境示意图，参见图1，该实施环境中可以包括语音采集设备110和计算机设备120，也可以单独是计算机设备120。

[0119] 在实施环境包括语音采集设备110和计算机设备120时，语音采集设备110可以通过网络或数据线与该计算机设备120连接。其中，语音采集设备110可以具有语音采集功能，可以采集会议中的多条语音信息。计算机设备120可以具有数据处理功能，可以对该语音采集设备110采集到的多条语音信息进行处理，生成摘要。

[0120] 在实施环境仅包括计算机设备120时，计算机设备120可以具有语音采集功能和数据处理功能，计算机设备120可以采集会议中的语音信息、对该会议中的语音信息进行处理，生成摘要。

[0121] 在一种可能实现方式中，该计算机设备120可以为终端或服务器中的任一种。

[0122] 图2是本公开实施例提供的一种摘要生成方法流程图，参见图2，该方法包括：

[0123] 201、计算机设备获取第一会议文本信息。

[0124] 本公开实施例中，该计算机设备可以为终端或者服务器。该第一会议文本信息可以包括多个文本片段和该多个文本片段中每个文本片段的发言人信息，该多个文本片段可以是会议中多个发言人在会议中的语音信息对应的文本信息。该发言人信息可以包括每个文本片段的发言人的标识信息或身份信息中的至少一种，该标识信息可以用于唯一的指示该发言人，例如，该标识信息可以为该发言人的姓名，或该发言人的编号。该身份信息可以包括发言人的职位、部门中的至少一种。

[0125] 该文本片段可以是句子，也可以是关键词。当该文本片段为句子时，可以直接获取第一会议文本信息中的句子。当该文本片段为关键词时，计算机设备可以提取第一会议本文信息的关键词，得到该第一会议文本信息中的关键词。

[0126] 在一种可能实现方式中，该发言人信息可以采用标签形式，计算机设备可以读取该标签，得到对应的发言人信息，在一种具体可能实现方式中，该标签可以是游标(Cursor)，计算机设备可以根据该游标，获取该游标对应的发言人信息。

[0127] 在一种可能实现方式中，该标识信息和该身份信息可以具有对应关系，计算机设备可以根据该发言人的标识信息，获取该标识信息对应的该发言人的身份信息。例如，该标识信息可以采用上述标签的形式，计算机设备可以读取该发言人的标签，从而得到该发言人的标识信息，也即是获知该发言人是谁，计算机设备还可以根据该标签，获取该标签对应的身份信息，从而获知该发言人的身份，比如职位、部门。

[0128] 计算机设备获取该第一会议文本信息的方式可以有多种，在一种可能实现方式中，该获取过程可以包括下述方式一至方式二中的任一种：

[0129] 方式一、计算机设备对会议中的语音信息进行语音识别，得到该第一会议文本信息中的该多个文本片段；对该会议中的语音信息进行声纹识别，得到该第一会议文本信息中每个文本片段的该发言人信息。

[0130] 在该方式一中，该语音识别用于将语音信息转换为文本信息，声纹识别用于识别语音信息中每个文本片段的发言人信息。对该会议中的每一条语音信息，计算机设备可以对该语音信息进行语音识别，生成识别结果也即是该第一会议文本信息中对应的文本片段，对该语音信息进行声纹识别，通过将声纹识别结果与该会议中多个发言人的声纹进行比对，匹配得到该语音信息对应的发言人信息。其中语音识别和声纹识别的方式可以有多种，本公开实施例对此不进行限定。

[0131] 方式二、计算机设备可以从数据库中提取该第一会议文本信息。

[0132] 在该方式二中，可以通过数据库来存储第一会议文本信息，在计算机设备需要对第一会议文本信息进行处理时，再从该数据库中提取。

[0133] 在一种可能实现方式中，计算机设备可以直接获取该会议中的全部语音信息，对该全部语音信息进行语音识别和声纹识别，得到该第一会议文本信息。

[0134] 在另一种可能实现方式中，计算机设备可以实时获取会议中的语音信息，再定期获取第一会议文本信息。具体地，计算机设备可以实时获取该会议中的语音信息，对实时获取的会议中的语音信息进行语音识别，得到第三会议文本信息中的多个文本片段；对实时获取的会议中的语音信息进行声纹识别，得到第三会议文本信息中每个文本片段的该发言人信息；获取预设周期内的多个第三会议文本信息作为该第一会议文本信息。

[0135] 计算机设备对每个时刻实时获取到的语音信息进行识别，均可以得到一个第三会议文本信息，进而，预设周期内，计算机设备可以识别得到多个第三会议文本信息，该多个第三会议文本信息可以包括不同时刻的会议中的语音信息对应的多个文本片段和每个文本片段的该发言人信息。计算机设备可以将预设周期内的多个第三会议文本信息作为该第一会议文本信息进行处理，也即是可以获取预设周期内的会议中的语音信息对应的多个文本片段和每个文本片段的该发言人信息。

[0136] 其中，该预设周期可以由技术人员根据需求进行设置，例如，该预设周期可以为一天，也可以为12个小时，本公开实施例对该预设周期的取值不作限定。

[0137] 例如，可以称该定期获取的模式为推模式，在一个具体的示例中，以该计算机设备为服务器为例，语音采集设备可以实时获取语音信息，并对语音信息进行识别，得到第三会议文本信息，再定时将预设周期内的多个第三会议文本信息作为第一会议文本信息发送至该服务器，以实现服务器侧的更新。

[0138] 在一种可能实现方式中，计算机设备获取预设周期内的多个第三会议文本信息作为该第一会议文本信息之后，可以根据该第一会议文本信息中每个文本片段的该发言人信息，对每个文本片段进行分类存储。该分类存储可以有多种方式，例如计算机设备可以按照该第一会议文本信息中每个文本片段对应的发言人的部门、小组、职位等分类按时间顺序进行存储，本公开实施例对此不进行限定。

[0139] 在一种可能实现方式中，计算机设备获取该第一会议文本信息后，可以在终端界面显示该第一会议文本信息，接收用户发出的对该第一会议文本信息的第一修改指令，基于用户的该第一修改指令，对该第一会议文本信息进行修正。该第一会议文本信息可以有多种显示方式，在一种可能实现方式中，该第一会议文本信息可以是计算机设备按照时间顺序，对该第一会议文本信息中每个文本片段和每个文本片段对应的发言人信息进行显示，显示的该发言人信息可以仅包括该发言人的姓名，也可以包括该发言人的姓名及对应的职位。本公开实施例计算机设备对该第一会议文本信息的显示方式不进行限定。

[0140] 在一种可能实现方式中，计算机设备基于用户的第一修改指令，对该第一会议文本信息进行修正后，可以对该第一修改指令所指示的文本片段以及对该文本片段的修改方式进行存储；当该第一会议文本信息中任一文本片段与存储的该文本片段匹配时，基于该文本片段的修改方式，对该任一文本片段进行修正。

[0141] 上述过程中，当该第一会议文本信息中任一文本片段与存储的该文本片段匹配时，也即是该第一文本信息中出现与该第一修改指令所指示的文本片段的相同错误时，计算机设备根据存储的对该文本片段的修改方式，对该任一文本片段进行修正。也即是基于存储的用户的第一修改指令，当该第一会议文本信息中出现相同的错误时，计算机设备可以自动修正该错误，而无需通过显示给用户由用户进行修改，减少了人工修正的工作量，降低人工成本，提高了修正效率，同时也避免了人工修正可能出现错误的情况，提高了该第一会议文本信息的准确性。

[0142] 在一个具体的可能实施例中，该自动修正的过程还可以为：当根据历史修正记录，确定接收到的第一修改指令的次数达到次数阈值时，对该第一修改指令所指示的文本片段以及对该文本片段的修改方式进行存储，从而可以根据存储的内容，执行后续的匹配和自动修正步骤。

[0143] 对于计算机设备判断该第一会议文本信息中任一文本片段与存储的该文本片段是否匹配的过程，可以有多种方式。在一种可能实现方式中，可以包括下述方式一至方式二中的任一种：

[0144] 方式一、计算机设备获取该第一会议文本信息中任一文本片段与存储的该文本片段的相似度，当该任一文本片段与该文本片段的相似度大于阈值时，确定该任一文本片段与该文本片段匹配。该任一文本片段与该文本片段的相似度大于阈值，该任一文本片段与该文本片段的相似度高，可以认为该任一文本片段与该文本片段匹配。

[0145] 方式二、计算机设备获取该第一会议文本信息中任一文本片段与存储的该文本片段目标位置的词性、语法结构或文字内容中至少一项的相似度，当该任一文本片段与该文本片段的目标位置的词性、语法结构或文字内容相似度大于对应的阈值时，确定该任一文本片段与该文本片段匹配。该目标位置可以是计算机设备基于该第一修改指令对该文本片段修改的位置，也可以是该文本片段中随机的位置，本公开实施例对此不进行限定。

[0146] 202、计算机设备基于该第一会议文本信息中多个文本片段和该多个文本片段中每个文本片段的发言人信息，获取该多个文本片段中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重。

[0147] 每个文本片段对应的权重可以用于指示每个文本片段的重要性，在本公开实施例中，衡量文本片段的重要性采用了任两个文本片段的相似度和每个文本片段的发言人对应的身份权重两个因素，不仅考虑到了任两个文本片段的相似度，还考虑到了会议中不同的发言人发言的重要性，进而能够更准确的衡量每个文本片段重要性。因此，计算机设备在此步骤可以获取该多个文本片段中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重。

[0148] 计算机设备获取该多个文本片段中任两个文本片段的相似度的方法可以有多种，例如计算机设备可以通过编辑距离计算、杰卡德系数计算、词频-逆文档频率(Term Frequency-Inverse Document Frequency，TF-IDF)算法等方法，计算机设备可以使用任意方法获取该多个文本片段中任两个文本片段的相似度，本公开实施例对此不进行限定。

[0149] 在一种可能实现方式中，该文本片段为句子，计算机设备可以通过下述公式一计算该任两个句子的相似度：

[0150] 公式一：

[0151] 在该公式中，Si和Sj表示任两个句子，j,i为任两个句子的标识。wk表示句子中的每个词语，k为每个词语的标识。|Si|和|Sj|为句子Si和Sj对应的词语数量，log为对数运算的符号，∈为属于符号，&为与符号，Similarity(Si,Sj)为句子Si和Sj的相似度。

[0152] 需要说明的是，获取任两个关键词的相似度的过程与上述过程同理，可以将用上述Si和Sj表示任两个关键词，wk表示关键词中的每个字，当然，也可以采用其他方式实现，本申请实施例对此不作限定。

[0153] 每个发言人对应的的身份权重可以代表每个发言人发言的重要性，计算机设备获取该多个文本片段中每个文本片段的发言人对应的身份权重可以有多种方式，在一种可能实现方式中，每个文本片段的发言人对应的身份权重的获取过程可以通过下述方式一至方式三中的任一项实现：

[0154] 方式一、对于每个发言人，计算机设备获取预设的该发言人对应的第一身份权重作为该发言人对应的身份权重。

[0155] 计算机设备中可以存储有发言人与第一身份权重的对应关系，每个发言人对应有第一身份权重，计算机设备可以根据该对应关系，获取该发言人对应的第一身份权重。该预设的该发言人对应的该第一身份权重可以由技术人员根据需求进行设置，本公开实施例对此不进行限定。

[0156] 方式二、对于每个发言人，计算机设备基于该发言人的身份信息，获取预设的该身份信息对应的第二身份权重作为该发言人对应的身份权重。

[0157] 计算机设备中可以存储有身份信息与第二身份权重的对应关系，每个身份信息可以对应有第二身份权重，计算机设备可以根据该对应关系，获取该身份信息对应的第一身份权重。该预设的该身份信息对应的该第二身份权重可以由技术人员根据需求进行设置，本公开实施例对此不进行限定。

[0158] 在一种可能实现方式中，该身份信息可以包括该发言人的职位、部门信息中的至少一种。例如，该身份信息可以仅包括该发言人的职位，可以仅包括该发言人的部门，还可以包括该发言人的职位和部门，本公开实施例对此不进行限定。对于该身份信息中不同的职位和不同的部门，该发言人的发言的重要性可以不同，可以设置有不同的身份权重。例如，通常，在一个会议中，对于相同的部门A，该部门A领导的发言比该部门A普通员工的发言重要，则该部门领导的身份权重可以比该部门普通员工的身份权重高，也即是该身份信息中不同的职位可以对应有不同的身份权重。再例如，对于不同的部门，会议内容相关的部门B人员的发言比其他部门人员的发言重要，该会议内容相关部门B人员的身份权重可以比其他部门人员的身份权重高，也即是该身份信息中不同的部门可以对应有不同的身份权重该会议内容相关的部门B可以为主持会议的部门。

[0159] 在一种可能实现方式中，计算机设备可以从发言人的身份信息中获取该发言人的职位、部门等信息和任两个发言人的关系。计算机设备可以发言人的身份信息，确定任两个发言人之间的关系，计算机设备在确定任一发言人对应的身份权重时，可以根据该发言人与其他发言人之间的关系以及该其他发言人对应的身份权重，确定该发言人对应的身份权重。计算机设备可以以图的形式存储每个发言人的身份权重和任两个发言人之间的关系，该任两个发言人之间的关系可以用是否有连线表示，例如任两个发言人在相同部门时，该任两个发言人可以用线条连接。计算机设备可以根据该发言人与其他发言人之间的关系以及该其他发言人对应的身份权重，确定该发言人对应的身份权重，例如，同部门的发言人发言的重要性也即是身份权重应该较为接近，当该发言人与其他发言人之间的关系为同部门的发言人工，当该其他发言人对应的身份权重较高时，计算机设备可以确定该发言人对应的身份权重也较高。

[0160] 方式三、对于每个发言人，计算机设备基于该第一会议文本信息中目标时间之前的第二会议文本信息，对该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重进行更新，将更新后的第三身份权重作为该发言人对应的身份权重。

[0161] 该第二会议文本信息可以是该第一会议文本信息中目标时间之前的多个文本片段和每个文本片段的发言人信息，计算机设备可以基于该第二会议文本信息对发言人对应的第一身份权重或发言人的身份信息对应的第二身份权重进行更新，也即是基于每个发言人的实际发言情况，对每个发言人对应的身份权重进行调整，保证在生成摘要时使用的每个发言人对应的身份权重更准确，从而提高生成摘要的准确率。也即是每个发言人对应的身份权重是动态变化的，计算机设备可以根据每个发言人对应语音信息的实际情况，动态调整每个发言人对应的身份权重，使每个发言人对应的身份权重更准确。

[0162] 上述计算机设备更新身份权重的过程可以包括下述方式一至方式二中的任一种：

[0163] 方式一、计算机设备基于该第一会议文本信息中目标时间之前的第二会议文本信息，对该发言人对应的第一身份权重进行更新，也即是仅对该发言人对应的身份权重进行调整。

[0164] 方式二、计算机设备基于该第一会议文本信息中目标时间之前的第二会议文本信息，对该发言人的身份信息对应的第二身份权重进行更新，也即是对该发言人和与该发言人相关的多个发言人对应的身份权重进行调整。

[0165] 每个发言人并非完全独立的，一个发言人对应的身份权重更新也可以影响与该发言人相关的多个发言人对应的身份权重，例如，一个发言人的职位为某个部门的领导，该发言人初始时权重较大，但计算机设备在更新该发言人对应的身份权重的过程中，获取到该发言人的多个文本片段中包含的关键信息较少，相应的，与该发言人同部门的其他发言人对应的多个文本片段包含的关键信息可能也较少，计算机设备可以降低该发言人所在部门的全部发言人中任一发言人对应的身份权重，也即是可以对该发言人的身份信息对应的第二身份权重进行更新，该身份信息可以是该发言人所在部门。

[0166] 对于每个发言人，计算机设备基于该第二会议文本信息，对该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重进行更新的方式可以有多种，本公开实施例对此不进行限定

[0167] 在一种可能实现方式中，更新方式可以包括下述更新方式一至更新方式二中的任一种：

[0168] 更新方式一、对于每个发言人，计算机设备基于该第二会议文本信息，提取该发言人的多个文本片段对应的第一摘要和该第二会议文本信息中所有文本片段对应的第二摘要，根据该第一摘要和该第二摘要的相似度，对该第一身份权重或该第二身份权重进行更新。

[0169] 计算机设备基于该第二会议文本信息，提取该发言人的多个文本片段对应的第一摘要和该第二会议文本信息中所有文本片段对应的第二摘要的方法可以由多种，例如该文本片段为句子时，可以有词频-逆文档频率(Term Frequency-Inverse Document Frequency，TF-IDF)算法、文字排名(TextRank)算法等方法，计算机设备可以使用任意方法提取该第一摘要和该第二摘要，本公开实施例对此不进行限定。

[0170] 对于每个发言人，该发言人的多个文本片段对应的该第一摘要和该第二会议文本信息中所有文本片段对应的该第二摘要的相似度越大，该发言人的发言也即是该多个文本片段与会议的主要内容越接近，该发言人的身份权重应该越高，计算机设备可以增加该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重。相反的，发言人的多个文本片段对应的该第一摘要和该第二会议文本信息中所有文本片段对应的该第二摘要的相似度越小，该发言人的发言也即是该多个文本片段与会议的主要内容越不接近，该发言人的身份权重应该越低，计算机设备可以降低该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重。

[0171] 更新方式二、对于每个发言人，计算机设备基于该第二会议文本信息，根据该发言人的多个文本片段和该第二会议文本信息中所有文本片段的相似度，对该第一身份权重或该第二身份权重进行更新。

[0172] 对于每个发言人，该发言人的多个文本片段对和该第二会议文本信息中所有文本片段的相似度越大，该发言人的发言也即是该多个文本片段与会议的主要内容越接近，该发言人的身份权重应该越高，计算机设备可以增加该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重。

[0173] 在一种可能实现方式中，该文本片段为句子，计算机设备基于该第一会议文本信息中目标时间之前的第二会议文本信息，对该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重进行更新的具体过程可以包括：对于每个发言人，计算机设备从该第二会议文本信息中，提取该发言人的多个句子的关键词，得到第一关键词集合，基于该第二会议文本信息中所有句子，获取第二关键词集合，根据该第一关键词集合和该第二关键词集合的相似度，对该第一身份权重或该第二身份权重进行更新。

[0174] 在本公开实施例中，计算机设备提取该发言人的多个句子的关键词和提取该第二会议文本信息中所有句子的关键词的方法可以有多种，例如词频-逆文档频率(Term Frequency-Inverse Document Frequency，TF-IDF)关键词提取方法、主题模型(Topic-model)关键词提取方法和文字排名(TextRank)算法等方法，计算机设备可以使用任意方法提取关键词，本公开实施例对此不进行限定。

[0175] 计算机设备从该第二会议文本信息中，提取该发言人的多个句子的关键词，得到第一关键词集合的方式可以有多种，在一种可能实现方式中，该方式可以包括：计算机设备基于该发言人的身份信息、该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重中的任一项，获取该发言人对应的关键词数量。基于该关键词数量，提取该发言人的多个句子的关键词，得到该第一关键词集合。

[0176] 该发言人的身份信息、该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重都可以表示该发言人发言的重要程度，该重要程度可以对该发言人对应的关键词数量有影响，根据不同的该重要程度，提取不同数量的关键词得到该第一关键词集合，可以是该第一关键词集合中的关键词更准确，进而使对发言人对应身份权中的调整更准确。例如，该发言人的身份信息为领导时，该发言人对应的关键词数量可以比该发言人的身份信息为普通员工时该发言人对应的关键词数量大。

[0177] 计算机设备基于该第二会议文本信息中所有句子，获取第二关键词集合的方式可以有多种，在一种可能实现方式中，该获取第二关键词集合的方式可以包括下述方式一至方式二中任一项：

[0178] 方式一、计算机设备提取该第二会议文本信息中所有句子的关键词，得到该第二关键词集合。

[0179] 计算机设备提取该第二会议文本信息中所有句子的关键词的方法可以有多种，例如词频-逆文档频率(Term Frequency-Inverse Document Frequency，TF-IDF)关键词提取方法、主题模型(Topic-model)关键词提取方法和文字排名(TextRank)算法等方法，该第二关键词集合中包括的关键词数量也可以有多种情况，本公开实施例对此不进行限定。

[0180] 方式二、计算机设备提取该第二会议文本信息中所有句子的关键词，将该第二会议文本信息中所有句子的关键词和预设的关键词的集合作为该第二关键词集合。

[0181] 该预设的关键词的集合可以是技术人员根据会议主题提前预设的，例如该会议的主题为保护环境，该预设的关键词的集合可以由环保、保护环境等关键词，该第二关键词集合由该第二会议文本信息中所有句子的关键词和该预设的关键词的集合两部分组成，可以使该第二关键词集合中包括的关键词更准确。

[0182] 在一种具体可能实现方式中，计算机设备基于根据该第一关键词集合和该第二关键词集合的相似度，对该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重进行更新的过程可以通过下述公式二实现：

[0183] 公式二：

[0184] WS(Vi)和WS(Vk)分别为句子Vi和Vk对应的权重，i,k为句子的标识，m为会议中发言人的数量，n为会议中所有句子的数量，∑为求和符号WS(Pi)为句子Vi的发言人对应的身份权重，其中n和m可以为正整数。计算机设备基于该公式更新用户对应的身份权重的方式可以是定时更新。

[0185] 203、计算机设备基于该任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，获取每个文本片段的权重。

[0186] 每个文本片段的权重可以代表每个文本片段在该第一会议记录中的重要性。计算机设备获取每个文本片段的权重的过程中不仅使用了该任两个文本片段的相似度，还使用了每个文本片段的发言人对应的身份权重。由于会议中每个发言人的发言重要性可能不同，该发言人对应的相同文本片段的重要性可以不同，而计算机设备在获取每个文本片段的权重时还考虑了该因素，相较于仅考虑该任两个文本片段的相似度，可以使获取的每个文本片段的权重更准确，进而提高生成的目标摘要的准确性。

[0187] 在一种可能实现方式中，计算机设备对于任一文本片段，基于与该任一文本片段的相似度大于相似度阈值的文本片段集合中每个文本片段的该权重，该文本片段集合中每个文本片段与其他的文本片段的相似度和该任一文本片段的发言人对应的身份权重，获取该任一文本片段的权重。

[0188] 计算机设备在获取任一文本片段的权重时，可以获取该文本片段与其他任意文本片段对应的相似度，该其他任意文本片段中对应的相似度大于该相似度阈值的文本片段为该文本片段集合中的文本片段，该其他任意文本片段对应的相似度小于该相似度阈值的文本片段也即是于该文本片段相似度低的文本片段，对该文本片段的权重影响较小，可以不考虑。因此计算机设备在获取时该文本片段的权重时仅使用该其他任意文本片段对应的相似度大于该相似度阈值的文本片段。该相似度阈值可以由技术人员根据需求进行设置，本公开实施例对此不进行限定。

[0189] 在一种具体可能实现方式中，该文本片段为句子，计算机设备可以用文字排名(TextRank)的方法，使用任两个句子的相似度加上每个句子的发言人对应的身份权重，获取每个句子的权重。该文字排名(TextRank)的方法用图来抽象文本内容，将每个句子视为一个节点，任意两个句子的相似度作为该任意两个句子对应节点连线的边权重，获取每个句子的权重。计算机设备可以通过计算任两个句子的相似度也即是任两个句子对应节点连线的边权重，筛选保留该任两个句子的相似度大于相似度阈值的连线，也即是在上述图中保留该任两个句子对应节点连线的边权重大于边权重阈值的连线。具体可以为下述公式三：

[0190] 公式三：

[0191] 在该公式三中，WS(Vi)表示句子Vi对应的权重，d为阻尼系数，表示图中任一节点指向其他节点的概率。In(Vi)和Out(Vj)分别为指向节点Vi集合和从节点Vj出发的边指向的节点集合,也即是In(Vi)是和节点Vi有连线的节点，Out(Vj)是和节点Vj有连线的节点。wji是图中节点Vi到Vj的边的权值，也即是句子Vi和句子Vj的相似度，wjk是图中节点Vi到Vk的边的权值，也即是句子Vi和句子Vk的相似度WS(Pi)为句子Vi的发言人对应的身份权重，i、j和k为句子的标识。该公式三中句子的相似度可以是根据步骤202中的公式一计算。

[0192] 在一个具体示例中，计算机设备可以实时接收会议的语音信息，可以对实时获取的会议中的语音信息进行语音识别，得到第三会议文本信息中的多个文本片段；对实时获取的会议中的语音信息进行声纹识别，得到第三会议文本信息中每个文本片段的该发言人信息；获取预设周期内的多个第三会议文本信息作为该第一会议文本信息，在该文本片段为句子时，计算机设备可以基于该第一文本信息，多次基于上述公式三获取每个句子的权重，根据该每个句子的权重，利用上述步骤202中的公式二，定时更新每个发言人对应身份权重。

[0193] 204、计算机设备基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要。

[0194] 计算机设备在获取到每个文本片段的权重后，可以选取权重较高的也即是较为重要的多个文本片段，生成该目标摘要。

[0195] 计算机设备在获取到生成摘要的文本片段后，具体生成该目标摘要的方式也可以有多种，该文本片段的形式不同，生成方式也可以不同。

[0196] 在一种可能实现方式中，该文本片段为句子时，该生成过程可以为：计算机设备可以基于该第一会议文本信息中该权重符合目标条件的句子，按照时间顺序进行拼接，得到该目标摘要。

[0197] 在另一种可能实现方式中，该文本片段为关键词时，该生成过程可以为：计算机设备可以基于该第一会议文本信息中该权重符合目标条件的关键词，以及自然语言生成规则，生成目标摘要。具体过程可以有多种方式，例如，计算机设备可以使用词性序列作为语法序列，将关键词在词性序列上填充，词性序列上每种词性都会对应相应的词的集合，没有被关键词填充的位置，可以用来作为备选，基于上述关键词在词性序列上的填充重复生成多个句子的备选，选出最优的句子，作为该目标摘要。

[0198] 在一种可能实现方式中，计算机设备在获取到生成摘要的文本片段后，可以将文本片段输入目标模型，由该目标模型输出该目标摘要，该目标模型可以是能够基于文本片段生成目标摘要的在自然语言生成模型，本公开实施例对该目标模型具体类型不进行限定。

[0199] 计算机设备具体基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要的方式可以有多种，在一种可能实现方式中，可以包括下述方式一至方式三中的任一种：

[0200] 方式一、计算机设备基于该第一会议文本信息中该权重大于目标阈值的文本片段，生成目标摘要。

[0201] 该权重大于目标阈值的文本片段，也即是该第一文本信息中较为重要的文本片段，基于该权重大于目标阈值的文本片段生成的该目标摘要，也即是该第一文本信息中较为重要的内容。该目标阈值可以由技术人员根据需求进行设置，本公开实施例对此不进行限定。

[0202] 方式二、计算机设备获取该第一会议文本信息中该权重大于该目标阈值的文本片段为候选文本片段，基于该候选文本片段中权重最大的目标比例的文本片段，生成目标摘要。

[0203] 该权重大于目标阈值的文本片段，也即是该第一文本信息中较为重要的文本片段，将该权重大于目标阈值的文本片段作为候选文本片段，对该候选文本片段获取目标比例的文本片段，该计算机设备可以对该较为重要的文本片段进一步筛选，得到更为重要的文本片段，生成的该目标摘要也更准确。该目标阈值和该目标比例可以由技术人员根据需求进行设置，本公开实施例对此不进行限定。

[0204] 方式三、计算机设备获取该第一会议文本信息中该权重大于该目标阈值的文本片段为候选文本片段，基于该候选文本片段中权重最大的目标数量的文本片段，生成目标摘要。

[0205] 该目标数量可以基于该第一会议文本信息中该权重大于该权重阈值的文本片段的数量确定，例如，该目标数量与该权重大于该权重阈值的文本片段的数量正相关，该文本片段的数量越大，该目标数量越大，本公开实施例对此不进行限定。计算机设备可以获取该候选文本片段中权重最大的目标数量的文本片段，也即是获取该第一会议文本信息中重要性最高的该目标数量的文本片段，基于该目标数量的文本片段生成的该目标摘要与该第一会议文本信息的主要内容较接近。

[0206] 在一种可能实现方式中，计算机设备也可以直接获取该第一会议文本信息中该权重最大的目标数量的句子，该目标数量可以由技术人员根据需求进行设置，本公开实施例对计算机设备基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要的过程不进行限定。

[0207] 在一种可能实现方式中，计算机设备生成目标摘要之后，还可以在终端界面显示该目标摘要，并基于用户的第二修改指令，对该目标摘要进行修正。该终端可以是该计算机设备本身，也可以是与该计算机设备通过网络连接的终端，本公开实施例对此不进行限定。该步骤计算机设备基于用户对该目标摘要的修正步骤，可以使该目标摘要更准确。

[0208] 本公开实施例提供的方法，根据会议文本信息中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，确定每个文本片段的权重，生成目标摘要，由于会议中不同的发言人发言的重要性不同，相比于只根据会议文本信息中任两个文本片段的相似度确定每个文本片段的权重，增加了发言人的身份权重因素，使得到的每个文本片段的权重更准确，进而生成的目标摘要也更准确，提高了目标摘要的准确率。

[0209] 在一个具体示例中，基于上述摘要生成方法在具体实现中可以有多种具体实现方式，下面提供一个摘要生成方法的具体应用实例，图3是本公开实施例提供的一种摘要生成方法流程图,参见图3。

[0210] 该流程图是基于计算机设备实时获取会议的语音信息过程的举例说明，在该图3中该文本片段为句子，在该流程图中，首先是声纹识别模块对麦克风接收到的语音数据也即是语音信息进行声纹识别，得到声纹识别结果后，可以同时进行两个步骤，一个步骤是通过语音识别模块对该语音数据进行识别，得到文本形式的语音识别结果；另一个步骤是使用声纹识别结果与声纹库中用户也即是发言人的声纹进行比对，通过比对匹配该语音数据和对应的身份信息，也即是对该语音数据对应的用户进行身份注册，匹配该用户在用户身份信息模块中对应的身份信息，匹配完成后，可以设置一个游标(Cursor)，用于标志当前正在进行语音识别的语音数据的发言人。该用户身份信息模块可以存储有用户的姓名、职位、部门等信息。

[0211] 完成上述语音识别和匹配步骤后，可以对该语音识别结果存入系统缓存，同时通过游标获取该语音数据的发言人。在系统缓存中不同语音数据对应的语音识别结果可以按部门、小组、职位等层级进行分类，并按时间顺序有序存储。由于语音数据是持续性输入麦克风并进行处理存储的，系统缓存与系统服务端过于频繁的交互会导致系统服务端压力过大，系统缓存中存储的多个语音识别结果以及对应的发言人可以采取推模式，由系统缓存定时同步该多个语音识别结果到系统服务端。

[0212] 系统服务端对于接收到的多个语音识别结果以及对应的发言人，也即是语音文本，可以对将该语音文本回显，也即是显示到终端的屏幕上，由人工发出修改指令，基于该修改指令对该语音文本进行修改并发送到存储模块进行存储。系统服务端和可以对该语音文本发送给摘要信息集模块并进行关键词信息提取，该摘要信息集模块根据基于上述提取的关键词信息或基于该语音文本提取的摘要，对用户身份权重模块的用户权重进行更新，并从用户身份权重模块获取的权重信息，基于该权重信息和该语音文本中任两个句子的相似度，提取摘要信息集，将该摘要信息集发送的摘要生成模块，按照时间顺序生成会议摘要，并将该会议摘要发送到存储模块进行存储。上述具体的生成摘要的步骤也即是上述步骤201至步骤204的摘要生成方法的步骤。该摘要信息集可以包括基于该会议文本信息提取的该会议文本信息对应的摘要，还可以包括基于每个发言人对应的对个语音识别结果提取的每个发言人对应的摘要。

[0213] 该用户身份权重模块可以根据该用户身份信息模块中的用户身份，对每个用户也即是发言人的身份权重赋予初值。系统服务端还可以将该语音文本也即是全量信息发送到存储模块进行存储。

[0214] 图4是本公开实施例提供的一种摘要生成装置结构示意图,参见图4，该装置包括:

[0215] 获取模块401，用于基于第一会议文本信息中多个文本片段和该多个文本片段中每个文本片段的发言人信息，获取该多个文本片段中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重；

[0216] 该获取模块401还用于基于该任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，获取每个文本片段的权重；

[0217] 生成模块402，用于基于该第一会议文本信息中该权重符合目标条件的文本片段，生成目标摘要。

[0218] 在一种可能实现方式中，该获取模块还用于：

[0219] 对于任一文本片段，基于与该任一文本片段的相似度大于相似度阈值的文本片段集合中每个文本片段的该权重，该文本片段集合中每个文本片段与其他的文本片段的相似度，以及该任一文本片段的发言人对应的身份权重，获取该任一文本片段的权重。

[0220] 在一种可能实现方式中，该获取模块还用于执行下述任一项：

[0221] 对于每个发言人，获取预设的该发言人对应的第一身份权重作为该发言人对应的身份权重；

[0222] 对于每个发言人，基于该发言人的身份信息，获取预设的该身份信息对应的第二身份权重作为该发言人对应的身份权重；

[0223] 对于每个发言人，基于该第一会议文本信息中目标时间之前的第二会议文本信息，对该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重进行更新，将更新后的第三身份权重作为该发言人对应的身份权重。

[0224] 在一种可能实现方式中，该装置还包括：

[0225] 更新模块，用于执行下述任一项：

[0226] 对于每个发言人，基于该第二会议文本信息，提取该发言人的多个文本片段对应的第一摘要和该第二会议文本信息中所有文本片段对应的第二摘要，根据该第一摘要和该第二摘要的相似度，对该第一身份权重或该第二身份权重进行更新；

[0227] 对于每个发言人，基于该第二会议文本信息，根据该发言人的多个文本片段和该第二会议文本信息中所有文本片段的相似度，对该第一身份权重或该第二身份权重进行更新。

[0228] 在一种可能实现方式中，该文本片段为句子；

[0229] 该更新模块还用于对于每个发言人，从该第二会议文本信息中，提取该发言人的多个句子的关键词，得到第一关键词集合，基于该第二会议文本信息中所有句子，获取第二关键词集合，根据该第一关键词集合和该第二关键词集合的相似度，对该第一身份权重或该第二身份权重进行更新。

[0230] 在一种可能实现方式中，该装置还包括提取模块，用于：

[0231] 基于该发言人的身份信息、该发言人对应的第一身份权重或该发言人的身份信息对应的第二身份权重中的任一项，获取该发言人对应的关键词数量；

[0232] 基于该关键词数量，提取该发言人的多个句子的关键词，得到该第一关键词集合。

[0233] 在一种可能实现方式中，该获取模块还用于执行下述任一项：

[0234] 提取该第二会议文本信息中所有句子的关键词，得到该第二关键词集合；

[0235] 提取该第二会议文本信息中所有句子的关键词，将该第二会议文本信息中所有句子的关键词和预设的关键词的集合作为该第二关键词集合。

[0236] 在一种可能实现方式中，

[0237] 该文本片段为句子；

[0238] 该生成模块还用于基于该第一会议文本信息中该权重符合目标条件的句子，按照时间顺序进行拼接，生成目标摘要；或，

[0239] 该文本片段为关键词；

[0240] 该生成模块还用于基于该第一会议文本信息中该权重符合目标条件的关键词，以及自然语言生成规则，生成目标摘要。

[0241] 在一种可能实现方式中，该生成模块还用于执行下述任一项：

[0242] 基于该第一会议文本信息中该权重大于目标阈值的文本片段，生成目标摘要；

[0243] 获取该第一会议文本信息中该权重大于该目标阈值的文本片段为候选文本片段，基于该候选文本片段中权重最大的目标比例的文本片段，生成目标摘要；

[0244] 获取该第一会议文本信息中该权重大于该目标阈值的文本片段为候选文本片段，基于该候选文本片段中权重最大的目标数量的文本片段，生成目标摘要，该目标数量基于该第一会议文本信息中该权重大于该权重阈值的文本片段的数量确定。

[0245] 在一种可能实现方式中，该装置还包括：

[0246] 语音识别模块，用于对会议中的语音信息进行语音识别，得到该第一会议文本信息中的该多个文本片段；

[0247] 声纹识别模块，用于对会议中的语音信息进行声纹识别，得到该第一会议文本信息中每个文本片段的该发言人信息。

[0248] 在一种可能实现方式中，

[0249] 该语音识别模块还用于对实时获取的会议中的语音信息进行语音识别，得到第三会议文本信息中的多个文本片段；

[0250] 该声纹识别模块还用于对实时获取的会议中的语音信息进行声纹识别，得到第三会议文本信息中每个文本片段的该发言人信息；

[0251] 该获取模块还用于获取预设周期内的多个第三会议文本信息作为该第一会议文本信息。

[0252] 在一种可能实现方式中，该装置还包括：

[0253] 存储模块，用于根据该第一会议文本信息中每个文本片段的该发言人信息，对每个文本片段进行分类存储。

[0254] 在一种可能实现方式中，该装置还包括：

[0255] 显示模块，用于在终端界面显示该第一会议文本信息；

[0256] 修正模块，用于基于用户的第一修改指令，对该第一会议文本信息进行修正。

[0257] 在一种可能实现方式中，

[0258] 该存储模块还用于对该第一修改指令所指示的文本片段以及对该文本片段的修改方式进行存储；

[0259] 该修正模块还用于当该第一会议文本信息中任一文本片段与存储的该文本片段匹配时，基于该文本片段的修改方式，对该任一文本片段进行修正。

[0260] 在一种可能实现方式中，

[0261] 该显示模块还用于在终端界面显示该目标摘要；

[0262] 该修正模块还用于基于用户的第二修改指令，对该目标摘要进行修正。本公开实施例提供的装置，根据会议文本信息中任两个文本片段的相似度和每个文本片段的发言人对应的身份权重，确定每个文本片段的权重，生成目标摘要，由于会议中不同的发言人发言的重要性不同，相比于只根据会议文本信息中任两个文本片段的相似度确定每个文本片段的权重，增加了发言人的身份权重因素，使得到的每个文本片段的权重更准确，进而生成的目标摘要也更准确，提高了目标摘要的准确率。

[0263] 需要说明的是：上述实施例提供的摘要生成装置在摘要生成时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的摘要生成装置与触摘要生成方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

[0264] 图5是本公开实施例提供的一种终端的结构示意图。该终端500可以是：智能手机、平板电脑、MP3(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

[0265] 通常，终端500包括有：一个或多个处理器501和一个或多个存储器502。

[0266] 处理器501可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器501可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central Processing Unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器501可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器501还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

[0267] 存储器502可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器502中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器501所执行以实现本公开中方法实施例提供的摘要生成方法。

[0268] 在一些实施例中，终端500还可选包括有：外围设备接口503和至少一个外围设备。处理器501、存储器502和外围设备接口503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口503相连。具体地，外围设备包括：射频电路
504、显示屏505、摄像头组件506、音频电路507、定位组件508和电源509中的至少一种。

[0269] 外围设备接口503可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器501和存储器502。在一些实施例中，处理器501、存储器502和外围设备接口503被集成在同一芯片或电路板上；在一些其他实施例中，处理器501、存储器502和外围设备接口503中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

[0270] 射频电路504用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路504将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路504包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路504还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本公开对此不加以限定。

[0271] 显示屏505用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏505是触摸显示屏时，显示屏505还具有采集在显示屏505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器501进行处理。此时，显示屏505还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏505可以为一个，设置终端500的前面板；在另一些实施例中，显示屏505可以为至少两个，分别设置在终端500的不同表面或呈折叠设计；在再一些实施例中，显示屏505可以是柔性显示屏，设置在终端500的弯曲表面上或折叠面上。甚至，显示屏505还可以设置成非矩形的不规则图形，也即异形屏。显示屏505可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

[0272] 摄像头组件506用于采集图像或视频。可选地，摄像头组件506包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件506还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

[0273] 音频电路507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器501进行处理，或者输入至射频电路504以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器501或射频电路
504的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路507还可以包括耳机插孔。

[0274] 定位组件508用于定位终端500的当前地理位置，以实现导航或LBS(Location Based Service，基于位置的服务)。定位组件508可以是基于美国的GPS(Global Positioning System，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

[0275] 电源509用于为终端500中的各个组件进行供电。电源509可以是交流电、直流电、一次性电池或可充电电池。当电源509包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

[0276] 在一些实施例中，终端500还包括有一个或多个传感器510。该一个或多个传感器510包括但不限于：加速度传感器511、陀螺仪传感器512、压力传感器513、指纹传感器514、光学传感器515以及接近传感器516。

[0277] 加速度传感器511可以检测以终端500建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器511可以用于检测重力加速度在三个坐标轴上的分量。处理器501可以根据加速度传感器511采集的重力加速度信号，控制显示屏505以横向视图或纵向视图进行用户界面的显示。加速度传感器511还可以用于游戏或者用户的运动数据的采集。

[0278] 陀螺仪传感器512可以检测终端500的机体方向及转动角度，陀螺仪传感器512可以与加速度传感器511协同采集用户对终端500的3D动作。处理器501根据陀螺仪传感器512采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

[0279] 压力传感器513可以设置在终端500的侧边框和/或显示屏505的下层。当压力传感器513设置在终端500的侧边框时，可以检测用户对终端500的握持信号，由处理器501根据压力传感器513采集的握持信号进行左右手识别或快捷操作。当压力传感器513设置在显示屏505的下层时，由处理器501根据用户对显示屏505的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

[0280] 指纹传感器514用于采集用户的指纹，由处理器501根据指纹传感器514采集到的指纹识别用户的身份，或者，由指纹传感器514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器501授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器514可以被设置终端500的正面、背面或侧面。当终端500上设置有物理按键或厂商Logo时，指纹传感器514可以与物理按键或厂商Logo集成在一起。

[0281] 光学传感器515用于采集环境光强度。在一个实施例中，处理器501可以根据光学传感器515采集的环境光强度，控制显示屏505的显示亮度。具体地，当环境光强度较高时，调高显示屏505的显示亮度；当环境光强度较低时，调低显示屏505的显示亮度。在另一个实施例中，处理器501还可以根据光学传感器515采集的环境光强度，动态调整摄像头组件506的拍摄参数。

[0282] 接近传感器516，也称距离传感器，通常设置在终端500的前面板。接近传感器516用于采集用户与终端500的正面之间的距离。在一个实施例中，当接近传感器516检测到用户与终端500的正面之间的距离逐渐变小时，由处理器501控制显示屏505从亮屏状态切换为息屏状态；当接近传感器516检测到用户与终端500的正面之间的距离逐渐变大时，由处理器501控制显示屏505从息屏状态切换为亮屏状态。

[0283] 本领域技术人员可以理解，图5中示出的结构并不构成对终端500的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

[0284] 图6是本公开实施例提供的一种服务器的结构示意图，该服务器600可因配置或性能不同而产生比较大的差异，可以包括一个或多个处理器(central processing units，CPU)601和一个或多个的存储器602，其中，该一个或多个存储器602中存储有至少一条指令，该至少一条指令由该一个或多个处理器601加载并执行以实现上述各个方法实施例提供的摘要生成方法。当然，该服务器600还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器600还可以包括其他用于实现设备功能的部件，在此不做赘述。

[0285] 在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由处理器执行以完成上述实施例中的摘要生成方法。例如，该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory，RAM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)、磁带、软盘和光数据存储设备等。

[0286] 本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

[0287] 上述仅为本公开的可选实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

标题	发布/更新时间	阅读量
一种视频摘要生成方法	2020-05-12	797
一种视频摘要生成方法	2020-05-12	427
摘要翻译器	2020-05-11	1010
单文档摘要生成方法	2020-05-12	526
摘要提取方法以及摘要提取模块	2020-05-11	357
一种自动文本摘要方法	2020-05-13	741
包括特定人的视频摘要	2020-05-13	456
图文摘要生成方法	2020-05-12	442
视频摘要生成方法和视频摘要生成装置	2020-05-13	928
多功能摘要书籍	2020-05-11	250

摘要生成方法、装置、设备及介质

摘要生成方法、装置、设备及介质

技术领域

背景技术

具体实施方式

该功能需要专业版企业版VIP权限，您可以：