首页 / 专利库 / 计算机网络 / 搜索引擎 / 一种在音视频中基于关键词的时间戳定位搜索方法

一种在音视频中基于关键词的时间戳定位搜索方法

阅读:613发布:2020-05-08

专利汇可以提供一种在音视频中基于关键词的时间戳定位搜索方法专利检索,专利查询,专利分析的服务。并且一种在音视频中基于关键词的时间戳 定位 搜索方法,包括以下步骤:S1:准备音频和视频;S2:将音频和视频中的音频部分通过第三方的 语音识别 技术进行文字识别,生成LRC文件,文件中包含文字时间戳;S3:对LRC文件内容的文字进行分词处理并存入ElasticSearch 搜索引擎 ;S4:对用户输入的关键字进行搜索并返回出现该关键字的时的时间戳。本 发明 中,实现对音频以及视频文件中,文字部分的关键字标记,并通过标记时间戳的方式,使得用户能够根据该时间戳快速找到该关键字在音频以及视频中出现的 位置 ,使用便捷且高效。,下面是一种在音视频中基于关键词的时间戳定位搜索方法专利的具体信息内容。

1.一种在音视频中基于关键词的时间戳定位搜索方法,其特征在于,包括以下步骤:
S1:准备音频和视频;
S2:将音频和视频中的音频部分通过第三方的语音识别技术进行文字识别,生成LRC文件,文件中包含文字时间戳;
S3:对LRC文件内容的文字进行分词处理并存入ElasticSearch搜索引擎
S4:对用户输入的关键字进行搜索并返回出现该关键字的时的时间戳。
2.根据权利要求1所述的在音视频中基于关键词的时间戳定位搜索方法,其特征在于,在S2中,LRC文件中包含时间起点、时间终点、中文翻译以及英文字幕。
3.根据权利要求1所述的在音视频中基于关键词的时间戳定位搜索方法,其特征在于,在S3中,搜索引擎分别对中文和英文进行分词处理,并形成关键字。
4.根据权利要求1所述的在音视频中基于关键词的时间戳定位搜索方法,其特征在于,在S3中,通过ElasticSearch的搜索API进行关键词查找,并返回汇总时间戳。
5.根据权利要求1所述的在音视频中基于关键词的时间戳定位搜索方法,其特征在于,在S2中,第三方的语音识别技术,包括但不限于讯飞、百度、阿里或者腾讯的语音识别技术。
6.根据权利要求1所述的在音视频中基于关键词的时间戳定位搜索方法,其特征在于,在S2中,在第三方语音识别对非中文或个别方言的识别准确率低的情况下,采用人工审核的方式进行修正。

说明书全文

一种在音视频中基于关键词的时间戳定位搜索方法

技术领域

[0001] 本发明涉及领域,尤其涉及一种在音视频中基于关键词的时间戳定位搜索方法。

背景技术

[0002] 现阶段视频有自动生成字幕功能,音频有自动生成歌词类文件的功能,但是,暂时还没有针对音视频中关键词出现位置的时间戳定位的功能,也没有像百度搜索关键词一样,对海量音视频文件进行内容搜索与定位的应用或工具。
[0003] 使用者在观看视频或音频时无法根据关键词而调整观看进度。

发明内容

[0004] (一)发明目的
[0005] 为解决背景技术中存在的技术问题,本发明提出一种在音视频中基于关键词的时间戳定位搜索方法。
[0006] (二)技术方案
[0007] 为解决上述问题,本发明提供了一种在音视频中基于关键词的时间戳定位搜索方法,包括以下步骤:
[0008] S1:准备音频和视频;
[0009] S2:将音频和视频中的音频部分通过第三方的语音识别技术进行文字识别,生成LRC文件,文件中包含文字时间戳;
[0010] S3:对LRC文件内容的文字进行分词处理并存入ElasticSearch搜索引擎
[0011] S4:对用户输入的关键字进行搜索并返回出现该关键字的时的时间戳。
[0012] 优选的,在S2中,LRC文件中包含时间起点、时间终点、中文翻译以及英文字幕。
[0013] 优选的,在S3中,搜索引擎分别对中文和英文进行分词处理,并形成关键字。
[0014] 优选的,在S3中,通过ElasticSearch的搜索API进行关键词查找,并返回汇总时间戳。
[0015] 优选的,在S2中,第三方的语音识别技术,包括但不限于讯飞、百度、阿里或者腾讯的语音识别技术。
[0016] 优选的,在S2中,在第三方语音识别对非中文或个别方言的识别准确率低的情况下,采用人工审核的方式进行修正。
[0017] 本发明的上述技术方案具有如下有益的技术效果:
[0018] 本发明中,实现对音频以及视频文件中,文字部分的关键字标记,并通过标记时间戳的方式,使得用户能够根据该时间戳快速找到该关键字在音频以及视频中出现的位置,使用便捷且高效。
[0019] 本发明中,LRC文件中包含时间起点、时间终点、中文翻译以及英文字幕,时间戳标记方便,标记效率高;将上述内容全部放入搜索引擎中,搜索引擎可根据中文和英文分别对语句进行分词处理,方便形成关键字,实现搜索;系统通过ElasticSearch的搜索API进行关键词查找,并返回汇总时间戳,系统整体工作效率高,准确率高。附图说明
[0020] 图1为本发明提出的在音视频中基于关键词的时间戳定位搜索方法的流程示意图。

具体实施方式

[0021] 为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
[0022] 如图1所示,本发明提出的一种在音视频中基于关键词的时间戳定位搜索方法,其特征在于,包括以下步骤:
[0023] S1:准备音频和视频;
[0024] S2:将音频和视频中的音频部分通过第三方的语音识别技术进行文字识别,生成LRC文件,文件中包含文字时间戳;
[0025] S3:对LRC文件内容的文字进行分词处理并存入ElasticSearch搜索引擎;
[0026] S4:对用户输入的关键字进行搜索并返回出现该关键字的时的时间戳。
[0027] 在一个可选的实施例中,在S2中,LRC文件中包含时间起点、时间终点、中文翻译以及英文字幕。
[0028] 在一个可选的实施例中,在S3中,搜索引擎分别对中文和英文进行分词处理,并形成关键字。
[0029] 在一个可选的实施例中,在S3中,通过ElasticSearch的搜索API进行关键词查找,并返回汇总时间戳。
[0030] 本发明中,实现对音频以及视频文件中,文字部分的关键字标记,并通过标记时间戳的方式,使得用户能够根据该时间戳快速找到该关键字在音频以及视频中出现的位置,使用便捷且高效。
[0031] 本发明中,LRC文件中包含时间起点、时间终点、中文翻译以及英文字幕,时间戳标记方便,标记效率高;将上述内容全部放入搜索引擎中,搜索引擎可根据中文和英文分别对语句进行分词处理,方便形成关键字,实现搜索;系统通过ElasticSearch的搜索API进行关键词查找,并返回汇总时间戳,系统整体工作效率高,准确率高。
[0032] 在一个可选的实施例中,在S2中,第三方的语音识别技术,包括但不限于讯飞、百度、阿里或者腾讯的语音识别技术。
[0033] 在一个可选的实施例中,在S2中,在第三方语音识别对非中文或个别方言的识别准确率低的情况下,采用人工审核的方式进行修正,人工修正准确率高,缺点是识别速度慢,成本高。
[0034] 应用举例:
[0035] 1、搜索关键字“三函数”,返回各个名校名师讲解视频的连接并定位到该知识点的时间戳位置。
[0036] 2、在一部具体的教学视频中,确定讲解某个概念的具体位置信息列表。
[0037] 3、通过对一部视频中关键字排序,发现讲解人的口话,以便自我发现与修正。
[0038] 4、为一组视频添加自动归类:针对国家安全部的语音材料关键词定位(电话语音相关);法庭语音相关关键取证信息定位(案件语音证据);售后关键词录音定位(售后录音文件);个人家庭视频(家庭音视频资源);教学视频(教学相关音视频)。
[0039] 应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈