首页 / 专利库 / 资料储存系统 / 数字音频文件 / 音轨 / 基于小波蚁群的声音和字幕精确对准系统

基于小波蚁群的声音和字幕精确对准系统

阅读:891发布:2020-05-13

专利汇可以提供基于小波蚁群的声音和字幕精确对准系统专利检索,专利查询,专利分析的服务。并且本 发明 涉及影音技术领域,且公开了基于小波蚁群的声音和字幕精确对准系统,包括声音和字幕对准系统,其特征在于:所述声音和字幕对准系统包括有音频处理子系统、字幕处理子系统、匹配子系统、传输子系统、处理器和显示器;所述音频处理子系统和字幕处理子系统均与处理器连接,所述处理器分别与匹配子系统和传输子系统双向连接,所述匹配子系统与传输子系统之间双向连接,所述传输子系统与显示器连接。本发明能够实现音频和字幕信息的快速匹配,使得声音和字幕能够自动同步,便于用户的观看,避免声音和字幕不同步而影响视频观看感受,更加让用户容易接受,便于推广使用。,下面是基于小波蚁群的声音和字幕精确对准系统专利的具体信息内容。

1.基于小波蚁群的声音和字幕精确对准系统,包括声音和字幕对准系统,其特征在于:
所述声音和字幕对准系统包括有音频处理子系统、字幕处理子系统、匹配子系统、传输子系统、处理器和显示器;
所述音频处理子系统和字幕处理子系统均与处理器连接,所述处理器分别与匹配子系统和传输子系统双向连接,所述匹配子系统与传输子系统之间双向连接,所述传输子系统与显示器连接。
2.根据权利要求1所述的基于小波蚁群的声音和字幕精确对准系统,其特征在于:所述音频处理子系统包括有音频采样、音频识别模块和音频存储模块。
3.根据权利要求1所述的基于小波蚁群的声音和字幕精确对准系统,其特征在于:所述字幕处理子系统包括有字幕采样模块、字幕识别模块和字幕存储模块。
4.根据权利要求1所述的基于小波蚁群的声音和字幕精确对准系统,其特征在于:所述匹配子系统包括有蚁群算法模块和匹配校准模块。
5.根据权利要求4所述的基于小波蚁群的声音和字幕精确对准系统,其特征在于:所述匹配校准模块包括有音轨识别单元、音轨调节单元、字幕解析单元、计时单元、判断校准单元和执行单元。
6.根据权利要求1所述的基于小波蚁群的声音和字幕精确对准系统,其特征在于:所述声音和字幕精确对准步骤如下:
S1 通过音频采集模块采集音频的音轨信息,然后将采集而来的音轨信息传输至音频识别模块,另一方面将音轨信息储存至音频存储模块中;
S2 通过字幕采集模块采集字幕的字符信息,然后将采集而来的字符信息传输至字幕识别模块,另一方面将字符信息储存至字幕存储模块中;
S3 上述音轨信息和字符信息通过处理器传输至匹配子系统,通过匹配校准模块中的音轨识别单元和音轨调节单元对音轨信息进行识别和调节,通过字幕解析单元对字符信息进行解析,通过计时单元对音轨信息和字符信息的时间戳进行记录,通过判断校准单元对音轨信息和字符信息的时间戳进行校准,然后通过蚁群算法模块优化分析校准的路径,再经由执行单元对音轨信息和字符信息进行匹配;
S4 经过匹配后的音轨信息和字符信息通过传输子系统传输至显示器,得以显示。

说明书全文

基于小波蚁群的声音和字幕精确对准系统

技术领域

[0001] 本发明涉及影音技术领域,具体为基于小波蚁群的声音和字幕精确对准系统。

背景技术

[0002] 随着社会和科学技术的发展,越来越多的智能产品融入人们的日常生活中,例如智能手机、智能电视、智能音箱和智能机器人等,其中智能手机和智能电视最为常见,智能手机和智能电视作为一种智能信息终端,不仅可以搜索和播放各种视频和音乐,还能够进行各种影音娱乐,丰富了人们的日常生活。
[0003] 在使用智能手机和智能电视观看视频时,由于视频压缩方式、视频大小和播放器解码能等因素的影响,视频播放过程中常常出现字幕与声音不能同步的问题,为观看视频带来不便,尤其是在播放非母语的影片过程中,声音和字幕的不同步会令用户更加难以接受,而目前能够自动对各种视频的声音和字幕精确对准的技术仍在大力研发中,上述问题亟待解决,为此,我们提出基于小波蚁群的声音和字幕精确对准系统。

发明内容

[0004] 鉴于现有技术存在的上述问题,本发明的一方面目的在于提供基于小波蚁群的声音和字幕精确对准系统。
[0005] 为了实现上述目的,本发明提供的基于小波蚁群的声音和字幕精确对准系统,包括声音和字幕对准系统,其特征在于:所述声音和字幕对准系统包括有音频处理子系统、字幕处理子系统、匹配子系统、传输子系统、处理器和显示器;
[0006] 所述音频处理子系统和字幕处理子系统均与处理器连接,所述处理器分别与匹配子系统和传输子系统双向连接,所述匹配子系统与传输子系统之间双向连接,所述传输子系统与显示器连接。
[0007] 优选的,所述音频处理子系统包括有音频采样、音频识别模块和音频存储模块。
[0008] 优选的,所述字幕处理子系统包括有字幕采样模块、字幕识别模块和字幕存储模块
[0009] 优选的,所述匹配子系统包括有蚁群算法模块和匹配校准模块。
[0010] 优选的,所述匹配校准模块包括有音轨识别单元、音轨调节单元、字幕解析单元、计时单元、判断校准单元和执行单元。
[0011] 优选的,所述声音和字幕精确对准步骤如下:
[0012] S1通过音频采集模块采集音频的音轨信息,然后将采集而来的音轨信息传输至音频识别模块,另一方面将音轨信息储存至音频存储模块中;
[0013] S2通过字幕采集模块采集字幕的字符信息,然后将采集而来的字符信息传输至字幕识别模块,另一方面将字符信息储存至字幕存储模块中;
[0014] S3上述音轨信息和字符信息通过处理器传输至匹配子系统,通过匹配校准模块中的音轨识别单元和音轨调节单元对音轨信息进行识别和调节,通过字幕解析单元对字符信息进行解析,通过计时单元对音轨信息和字符信息的时间戳进行记录,通过判断校准单元对音轨信息和字符信息的时间戳进行校准,然后通过蚁群算法模块优化分析校准的路径,再经由执行单元对音轨信息和字符信息进行匹配;
[0015] S4经过匹配后的音轨信息和字符信息通过传输子系统传输至显示器,得以显示。
[0016] 与现有技术相比较,本发明提供的基于小波蚁群的声音和字幕精确对准系统,具有以下有益效果:
[0017] 本发明通过音频处理子系统和字幕处理子系统的组合设计,实现对各种视频的音频和字幕信息的收集和识别,通过处理器和匹配子系统对信息的解析、判断和校准,利用蚁群算法优化计算路径,实现音频和字幕信息的快速匹配,使得声音和字幕能够自动同步,便于用户的观看,避免声音和字幕不同步而影响视频观看感受,更加让用户容易接受,便于推广使用。附图说明
[0018] 图1为本发明声音和字幕对准系统的示意图;
[0019] 图2为本发明音频处理子系统的示意图;
[0020] 图3为本发明字幕处理子系统示意图;
[0021] 图4为本发明匹配子系统的示意图;
[0022] 图5为本发明匹配校准模块的示意图。

具体实施方式

[0023] 为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0024] 除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
[0025] 为了保持本公开实施例的以下说明清楚且简明,本公开省略了已知功能和已知部件的详细说明。
[0026] 请参阅图1-5,基于小波蚁群的声音和字幕精确对准系统,包括声音和字幕对准系统,其特征在于:所述声音和字幕对准系统包括有音频处理子系统、字幕处理子系统、匹配子系统、传输子系统、处理器和显示器;
[0027] 所述音频处理子系统和字幕处理子系统均与处理器连接,所述处理器分别与匹配子系统和传输子系统双向连接,所述匹配子系统与传输子系统之间双向连接,所述传输子系统与显示器连接。
[0028] 优选的,所述音频处理子系统包括有音频采样模块、音频识别模块和音频存储模块。
[0029] 优选的,所述字幕处理子系统包括有字幕采样模块、字幕识别模块和字幕存储模块
[0030] 优选的,所述匹配子系统包括有蚁群算法模块和匹配校准模块。
[0031] 优选的,所述匹配校准模块包括有音轨识别单元、音轨调节单元、字幕解析单元、计时单元、判断校准单元和执行单元。
[0032] 优选的,所述声音和字幕精确对准步骤如下:
[0033] S1通过音频采集模块采集音频的音轨信息,然后将采集而来的音轨信息传输至音频识别模块,另一方面将音轨信息储存至音频存储模块中;
[0034] S2通过字幕采集模块采集字幕的字符信息,然后将采集而来的字符信息传输至字幕识别模块,另一方面将字符信息储存至字幕存储模块中;
[0035] S3上述音轨信息和字符信息通过处理器传输至匹配子系统,通过匹配校准模块中的音轨识别单元和音轨调节单元对音轨信息进行识别和调节,通过字幕解析单元对字符信息进行解析,通过计时单元对音轨信息和字符信息的时间戳进行记录,通过判断校准单元对音轨信息和字符信息的时间戳进行校准,然后通过蚁群算法模块优化分析校准的路径,再经由执行单元对音轨信息和字符信息进行匹配;
[0036] S4经过匹配后的音轨信息和字符信息通过传输子系统传输至显示器,得以显示。
[0037] 本发明通过音频处理子系统和字幕处理子系统的组合设计,实现对各种视频的音频和字幕信息的收集和识别,通过处理器和匹配子系统对信息的解析、判断和校准,利用蚁群算法优化计算路径,实现音频和字幕信息的快速匹配,使得声音和字幕能够自动同步,便于用户的观看,避免声音和字幕不同步而影响视频观看感受,更加让用户容易接受,便于推广使用。
[0038] 本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
[0039] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈