首页 / 专利库 / 人工智能 / 人工智能 / 自然语言处理 / 一种用于提供视频节目内容总结的方法及其系统

一种用于提供视频节目内容总结的方法及其系统

阅读:230发布:2020-05-08

专利汇可以提供一种用于提供视频节目内容总结的方法及其系统专利检索,专利查询,专利分析的服务。并且本 申请 公开了一种用于提供视频节目内容总结的方法及其系统,所述方法包括如下步骤:提取视频台词文字,整合成txt文本;将非结构化文本转变为结构化数据;提取结构化数据中的关键信息;将关键信息和所述视频相关联;将关键信息保存为语音形式;获取所述视频的背景图片;将关键信息和背景图片相关联。本申请通过对视频台词文字进行分析,构造语音形式的视频节目内容总结,从而为用户提供方便、快捷的节目选择经历。,下面是一种用于提供视频节目内容总结的方法及其系统专利的具体信息内容。

1.一种用于提供视频节目内容总结的方法,包括如下步骤:
提取视频台词文字,整合成txt文本;
将非结构化文本转变为结构化数据;
提取结构化数据中的关键信息;
将关键信息和所述视频相关联;
将关键信息保存为语音形式;
获取所述视频的背景图片;
将关键信息和背景图片相关联。
2.如权利要求1所述的方法,其中利用自然语言处理技术进行词性分析、词性标注,将非结构化文本转变为结构化数据。
3.如权利要求1所述的方法,其中提取结构化数据的关键信息包括如下子步骤:
对结构化数据进行要素分析;
提取要素点;
将要素点进行整合,形成关键信息。
4.如权利要求1所述的方法,其中将关键信息保存为语音形式包括将关键信息输入语音转换模获得关键信息对应的音频文件。
5.如权利要求4所述的方法,其中语音转换模块基于深度神经网络,预先训练所述深度神经网络,包括如下子步骤:
构造训练样本库,其中训练样本库包括训练文本,以及所述训练文本的样本音频信息;
构建深度神经网络,找到隐藏层最佳神经元个数;
将训练文本作为所述深度神经网络的输入,获得音频信息;
构造所述音频信息的特征矩阵Ti和所述样本音频信息的特征矩阵Ti’;
根据Ti和Ti’确定音频差异度αi;
根据所有音频差异度αi确定总的音频差异度β;
在β小于所述深度神经网络的最小均方误差目标时训练结束。
6.如权利要求5所述的方法,其中音频差异度使用如下公式计算:
αi=Ti-Ti'。
7.如权利要求6所述的方法,其中总的音频差异度β使用如下公式计算:
其中n是输入深度神经网络的训练文本总个数。
8.如权利要求1所述的方法,其中抽取所述视频的关键作为背景图片。
9.如权利要求1所述的方法,其中抽取所述视频的关键帧作为背景图片包括如下步骤:
从结构化数据中抽取关键词;
根据关键词词频确定视频类型;
查询类型库,依据类型库获得抽取信息;
依据抽取信息抽取视频的关键帧,作为背景图片。
10.一种用于提供视频节目内容总结的系统,包括处理器,其中处理器执行如权利要求
1-9之一所述的方法。

说明书全文

一种用于提供视频节目内容总结的方法及其系统

技术领域

[0001] 本申请涉及计算机领域,特别的涉及一种用于提供视频节目内容总结的方法及其系统。

背景技术

[0002] 随着视频技术的发展,人们需要更多的休闲活动来缓解工作压和生活压力,以电视节目为代表的视频节目因此大幅增加,但是在节目选择方面,用户需要花费大量的时间从节目中查找用户感兴趣的节目,有时还可能从大量节目中找不到感兴趣的节目,现有的视频节目内容总结的实现方式通常通过人为的观看视频、梳理故事情节、人为进行内容总结,而非自动生成内容总结环节。
[0003] 人工制作的视频形式的内容总结,每个视频节目都需单独制作归纳总结的视频片段,制作和维护成本高,规模效益差。发明内容
[0004] 本申请请求保护一种用于提供视频节目内容总结的方法及其系统,相比较传统的视频节目内容总结,本申请在有高数量级视频节目时,可以自动为每个视频提炼总结,并自动嵌套入模板,形成在每个视频节目后都有内容总结环节,节省了大量的人工操作,并提供高识别率以及执行率。
[0005] 本申请请求保护一种用于提供视频节目内容总结的方法,包括如下步骤:提取视频台词文字,整合成txt文本;将非结构化文本转变为结构化数据;提取结构化数据中的关键信息;将关键信息和所述视频相关联;将关键信息保存为语音形式;获取所述视频的背景图片;将关键信息和背景图片相关联。
[0006] 优选地,其中利用自然语言处理技术进行词性分析、词性标注,将非结构化文本转变为结构化数据。
[0007] 优选地,其中提取结构化数据的关键信息包括如下子步骤:对结构化数据进行要素分析;提取要素点;将要素点进行整合,形成关键信息。
[0008] 优选地,其中将关键信息保存为语音形式包括将关键信息输入语音转换模获得关键信息对应的音频文件。
[0009] 优选地,其中语音转换模块基于深度神经网络,预先训练所述深度神经网络,包括如下子步骤:构造训练样本库,其中训练样本库包括训练文本,以及所述训练文本的样本音频信息;构建深度神经网络,找到隐藏层最佳神经元个数;将训练文本作为所述深度神经网络的输入,获得音频信息;构造所述音频信息的特征矩阵Ti和所述样本音频信息的特征矩阵Ti’;根据Ti和Ti’确定音频差异度αi;根据所有音频差异度αi确定总的音频差异度β;在β小于所述深度神经网络的最小均方误差目标时训练结束。
[0010] 优选地,其中音频差异度使用如下公式计算:αi=Ti-Ti'。
[0011] 优选地,其中总的音频差异度β使用如下公式计算:
[0012] 其中n是输入深度神经网络的训练文本总个数。
[0013] 优选地,其中抽取所述视频的关键作为背景图片。
[0014] 优选地,其中抽取所述视频的关键帧作为背景图片包括如下步骤:从结构化数据中抽取关键词;根据关键词词频确定视频类型;查询类型库,依据类型库获得抽取信息;依据抽取信息抽取视频的关键帧,作为背景图片。
[0015] 本申请还请求保护一种用于提供视频节目内容总结的系统,包括处理器,其中处理器执行如上述的方法。
[0016] 本申请通过对视频台词文字进行分析,构造语音形式的视频节目内容总结,从而为用户提供方便、快捷的节目选择经历。附图说明
[0017] 为了更清楚地说明本申请实施例现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0018] 图1是本申请的方法的方法流程图

具体实施方式

[0019] 下面结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020] 本申请提出一种用于提供视频节目内容总结的方法,如图1所示,包括如下步骤:
[0021] 步骤S210、提取视频台词文字,整合成txt文本;
[0022] 步骤S220、将非结构化文本转变为结构化数据;
[0023] 利用自然语言处理技术进行词性分析、词性标注,将非结构化文本转变为结构化数据。
[0024] 步骤S230、提取结构化数据中的关键信息;包括如下子步骤:
[0025] 步骤S2301、对结构化数据进行要素分析;
[0026] 步骤S2302、提取要素点;
[0027] 例如提取时间、地点、人物、事件等作为要素点。
[0028] 步骤S2303、将要素点进行整合,形成关键信息。
[0029] 将要素点嵌入预先设置的模板中,形成关键信息。
[0030] 步骤S240、将关键信息和所述视频相关联;
[0031] 步骤S250、将关键信息保存为语音形式;包括将关键信息输入语音转换模块获得关键信息对应的音频文件。
[0032] 语音转换模块基于深度神经网络,预先训练所述深度神经网络,包括如下子步骤:
[0033] 构造训练样本库,其中训练样本库包括训练文本,以及所述训练文本的样本音频信息;
[0034] 构建深度神经网络,找到隐藏层最佳神经元个数;
[0035] 将训练文本作为所述深度神经网络的输入,获得音频信息;
[0036] 构造所述音频信息的特征矩阵Ti和所述样本音频信息的特征矩阵Ti’;
[0037] 根据Ti和Ti’确定音频差异度αi;
[0038] αi=Ti-Ti'
[0039] 根据所有音频差异度αi确定总的音频差异度β;
[0040]
[0041] 其中n是输入深度神经网络的训练文本总个数。
[0042] 在β小于所述深度神经网络的最小均方误差目标时训练结束。
[0043] 最小均方误差预先给出,代表深度神经网络训练的指标。
[0044] 步骤S260、获取所述视频的背景图片;
[0045] 抽取所述视频的关键帧作为背景图片,包括如下步骤:
[0046] 步骤S2601、从结构化数据中抽取关键词;
[0047] 步骤S2602、根据关键词词频确定视频类型;
[0048] 例如,视频的关键词中频繁出现小猪佩奇,则可确定该视频为动画视频。
[0049] 步骤S2603、查询类型库,依据类型库获得抽取信息;
[0050] 预先构造类型库,类型库中保存各个类型的视频需要抽取的关键帧的位置,即抽取信息。例如动画视频抽取信息为:高频词出现时的帧。
[0051] 步骤S2604、依据抽取信息抽取视频的关键帧,作为背景图片。
[0052] 抽取的关键帧一般为多个,对关键帧进行比较,选择重合度最高的帧作为背景图片。
[0053] 步骤S270、将关键信息和背景图片相关联。
[0054] 将上述语音形式的关键信息和背景图片相关联,在向用户显示节目列表时,将关键信息和背景图片一起显示。
[0055] 本申请还请求保护一种提供视频节目内容总结的系统,包括处理器,其中处理器执行如上所述的方法。
[0056] 对应于图1中的方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述安全控制的方法的步骤。
[0057] 具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述在线签发eSIM证书的方法。
[0058] 在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0059] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0060] 另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0061] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0062] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0063] 最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈