首页 / 专利分类库 / 乐器;声学 / 音频编码方法、装置、介质、设备和程序产品

音频编码方法、装置、介质、设备和程序产品

申请号 CN202410156543.6 申请日 2024-02-04 公开(公告)号 CN117935822A 公开(公告)日 2024-04-26
申请人 深圳百瑞互联技术有限公司; 发明人 李强; 王凌志; 叶东翔; 朱勇;
摘要 本 申请 公开了一种支持低频增强的音频编码方法、装置、介质、设备和程序产品,属于音频编解码技术领域。该方法包括:在音频播放设备具有重低音播放能 力 时,根据低频效果声道参数,将音频中的低频 信号 通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、 熵编码 、残余编码和位流复用的处理,得到音频对应的码流;在音频播放设备不具有重低音播放能力时,根据低频效果声道参数,生成音频对应的虚拟低音,并将虚拟低音 叠加 到音频的原始声道上,利用完成叠加的音频进行L2HC编码。本申请能够在减少计算量的条件下,支持单声道和双声道的音频生成低频效果,增强了用户体验。
权利要求

1.一种支持低频增强的音频编码方法,其特征在于,包括:
判断步骤,获取音频播放设备的重低音播放能参数和音频的低频效果声道参数,并根据所述重低音播放能力参数对所述音频采用不同的编码方法;
第一编码步骤,在所述音频播放设备具有重低音播放能力时,根据所述低频效果声道参数,将所述音频中的低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到所述音频对应的码流;
第二编码步骤,在所述音频播放设备不具有重低音播放能力时,根据所述低频效果声道参数,生成所述音频对应的虚拟低音,并将所述虚拟低音叠加到所述音频的原始声道上,以及,利用完成叠加的音频进行L2HC编码。
2.根据权利要求1所述的支持低频增强的音频编码方法,其特征在于,所述第一编码步骤包括:
当所述音频中不包含低频效果声道时,通过从所述音频中提取低频信号,并将所述低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到所述音频对应的码流;
其中,从所述音频中提取低频信号的过程,包括:在所述音频是双声道音频或多声道音频时,通过将所述音频进行下混处理,得到所述音频对应的低频信号。
3.根据权利要求1所述的支持低频增强的音频编码方法,其特征在于,所述第一编码步骤包括:
通过将单声道音频、具有低频效果声道音频和完成下混处理的音频,利用非对称时延窗函数,进行离散余弦变换,得到低频音频谱系数。
4.根据权利要求3所述的支持低频增强的音频编码方法,其特征在于,所述第一编码步骤包括:
在进行低通滤波之前进行所述离散余弦变换处理,或在进行所述低通滤波之后进行所述离散余弦变换处理;
其中,当在进行所述低通滤波之后进行所述离散余弦变换处理时,利用所述低频音频谱系数中的预定个数个所述低频音频谱系数进行滤波处理,得到所述低频音频谱系数对应的滤波音频谱系数。
5.根据权利要求1所述的支持低频增强的音频编码方法,其特征在于,所述第一编码步骤包括:
设定编码过程中的编码码率为最低码率,并设定低码率标识符为1。
6.根据权利要求1所述的支持低频增强的音频编码方法,其特征在于,所述第二编码步骤包括:
在所述音频中不包含具有低频效果声道音频时,通过将所述音频中的基频部分滤除,并将剩余各次谐波的叠加,生成所述音频对应的虚拟低音。
7.一种支持低频增强的音频编码装置,其特征在于,包括:
判断模,用于获取音频播放设备的重低音播放能力参数和音频的低频效果声道参数,并根据所述重低音播放能力参数对所述音频采用不同的编码方法;
第一编码模块,用于在所述音频播放设备具有重低音播放能力时,根据所述低频效果声道参数,将所述音频中的低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到所述音频对应的码流;
第二编码模块,用于在所述音频播放设备不具有重低音播放能力时,根据所述低频效果声道参数,生成所述音频对应的虚拟低音,并将所述虚拟低音叠加到所述音频的原始声道上,以及,利用完成叠加的音频进行L2HC编码。
8.一种计算机可读存储介质,其存储有计算机程序/指令,其特征在于,所述计算机程序/指令被操作以执行如权利要求1‑6中任一项所述的支持低频增强的音频编码方法。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现如权利要求1‑6中任一项所述的支持低频增强的音频编码方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1‑6中任一项所述的支持低频增强的音频编码方法。

说明书全文

音频编码方法、装置、介质、设备和程序产品

技术领域

[0001] 本申请涉及音频编解码技术领域,特别涉及一种支持低频增强的音频编码方法、装置、存储介质、电子设备和计算机程序产品。

背景技术

[0002] 为了给用户在短距离无线通信领域,提供更好的高清音频体验,由中国电子音响行业协会(CAIA)和中国电子技术标准化研究院联合国内近四十家单位制定了L2HC标准。L2HC标准是全球首个统一架构、全码率无线音频编解码标准,其在传输速率、抗干扰和兼容性等多个方面全球领先。L2HC将音频传输码率扩展至64k‑1920kbps,且其支持96kHz/24bit高清音频传输。
[0003] 在现实应用场景中,LFE(Low Frequency Effects,低频效果声道)通常用于增强低频效果,使听者感受到更加逼真的音效,如电影中的爆炸声、撞击声等。但使用L2HC标准进行LFE的传输其不足在于:首先,常见的多声道音频,如2.1音频、5.1音频或7.1音频等,其中音频中的.1表示的就是LFE声道,LFE声道的有效频带非常窄,因此,将此声道当作一个普通的声道来编码,会造成码率浪费,同时由于LFE音频既非全频带信号,也不是L2HC的带宽检测模能区分的部分频带信号,LFE音频的带宽通常为80Hz‑120Hz,将其按照普通的编码方法进行编码有可能造成频谱泄露或造成音质下降。其次,常见的单声道音频或双声道立体声音频,其音频中并没有LFE声道的音频信息,因此无法直接生成LFE声道信息,影响用户体验。发明内容
[0004] 针对现有技术存在的按照现有编码方法编码低频效果声道造成的频谱泄露和音质降低,以及无法通过常见的单声道音频或双声道立体声音频生成低频效果声道的问题,本申请主要提供一种支持低频增强的音频编码方法、装置、存储介质、电子设备和计算机程序产品。
[0005] 为了实现上述目的,本申请采用的第一个技术方案是:提供一种支持低频增强的音频编码方法,其包括:判断步骤,获取音频播放设备的重低音播放能参数和音频的低频效果声道参数,并根据重低音播放能力参数对音频采用不同的编码方法;第一编码步骤,在音频播放设备具有重低音播放能力时,根据低频效果声道参数,将音频中的低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到音频对应的码流;第二编码步骤,在音频播放设备不具有重低音播放能力时,根据低频效果声道参数,生成音频对应的虚拟低音,并将虚拟低音叠加到音频的原始声道上,以及,利用完成叠加的音频进行L2HC编码。
[0006] 可选的,第一编码步骤包括:当音频中不包含低频效果声道时,通过从音频中提取低频信号,并将低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到音频对应的码流;其中,从音频中提取低频信号的过程,包括:在音频是双声道音频或多声道音频时,通过将音频进行下混处理,得到音频对应的低频信号。
[0007] 可选的,第一编码步骤包括:通过将单声道音频、具有低频效果声道音频和完成下混处理的音频,利用非对称时延窗函数,进行离散余弦变换,得到低频音频谱系数。
[0008] 可选的,第一编码步骤包括:在进行低通滤波之后进行离散余弦变换处理,或在进行低通滤波之后进行离散余弦变换处理;其中,当在进行低通滤波之后进行离散余弦变换处理时,利用低频音频谱系数中的预定个数个低频音频谱系数进行滤波处理,得到低频音频谱系数对应的滤波音频谱系数。
[0009] 可选的,第一编码步骤包括:设定编码过程中的编码码率为最低码率,并设定低码率标识符为1。
[0010] 可选的,第二编码步骤包括:在音频中不包含具有低频效果声道音频时,通过将音频中的基频部分滤除,并将剩余各次谐波的叠加,生成音频对应的虚拟低音。
[0011] 本申请采用的第二个技术方案是:提供一种支持低频增强的音频编码装置,其包括:判断模块,用于获取音频播放设备的重低音播放能力参数和音频的低频效果声道参数,并根据重低音播放能力参数对音频采用不同的编码方法;第一编码模块,用于在音频播放设备具有重低音播放能力时,根据低频效果声道参数,将音频中的低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到音频对应的码流;
[0012] 第二编码模块,用于在音频播放设备不具有重低音播放能力时,根据低频效果声道参数,生成音频对应的虚拟低音,并将虚拟低音叠加到音频的原始声道上,以及,利用完成叠加的音频进行L2HC编码。
[0013] 可选的,第一编码模块包括:在音频是双声道音频或多声道音频时,通过将音频进行下混处理,得到音频对应的低频信号。
[0014] 可选的,第一编码模块包括:通过将单声道音频、具有低频效果声道音频和完成下混处理的音频,利用非对称时延窗函数,进行离散余弦变换,得到低频音频谱系数。
[0015] 可选的,第一编码模块包括:在进行低通滤波之后进行离散余弦变换处理,或在进行低通滤波之后进行离散余弦变换处理;其中,当在进行低通滤波之后进行离散余弦变换处理时,利用低频音频谱系数中的预定个数个低频音频谱系数进行滤波处理,得到低频音频谱系数对应的滤波音频谱系数。
[0016] 可选的,第一编码模块包括:设定编码过程中的编码码率为最低码率,并设定低码率标识符为1。
[0017] 可选的,第二编码模块包括:在音频中不包含具有低频效果声道音频时,通过将音频中的基频部分滤除,并将剩余各次谐波的叠加,生成音频对应的虚拟低音。
[0018] 本申请采用的第三个技术方案是:提供一种计算机可读存储介质,其存储有计算机程序/指令,该计算机程序/指令被操作以执行方案一中的支持低频增强的音频编码方法。
[0019] 本申请采用的第四个技术方案是:提供一种计算机设备,包括存储器、处理器以及存储在存储器上的计算机程序,该处理器执行计算机程序以实现方案一中的支持低频增强的音频编码方法。
[0020] 本申请采用的第五个技术方案是:提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如方案一中的支持低频增强的音频编码方法。
[0021] 本申请的技术方案可以达到的有益效果是:能够解决按照现有编码方法编码低频效果声道造成的频谱泄露和音质降低,以及无法通过常见的单声道音频或双声道立体声音频生成低频效果声道的问题,从而提高具有低频效果声道音频所编码音频的音质,减少编码过程中的频谱泄露。附图说明
[0022] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023] 图1是本申请一种支持低频增强的音频编码方法的一个具体实施方式的示意图;
[0024] 图2是本申请一种支持低频增强的音频编码方法的第一编码步骤的流程图
[0025] 图3是本申请一种支持低频增强的音频编码方法的第二编码步骤的流程图;
[0026] 图4是本申请一种支持低频增强的音频编码装置的一个具体实施方式的示意图。
[0027] 通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

[0028] 下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
[0029] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0030] 下面,以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面述及的具体的实施例可以相互结合形成新的实施例。对于在一个实施例中描述过的相同或相似的思想或过程,可能在其他某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
[0031] 图1示出了本申请一种支持低频增强的音频编码方法的一个实施方式。
[0032] 图1所示的支持低频增强的音频编码方法,包括:判断步骤S101,获取音频播放设备的重低音播放能力参数和音频的低频效果声道参数,并根据重低音播放能力参数对音频采用不同的编码方法;
[0033] 第一编码步骤S102,在音频播放设备具有重低音播放能力时,根据低频效果声道参数,将音频中的低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到音频对应的码流;
[0034] 第二编码步骤S103,在音频播放设备不具有重低音播放能力时,根据低频效果声道参数,生成音频对应的虚拟低音,并将虚拟低音叠加到音频的原始声道上,以及,利用完成叠加的音频进行L2HC编码。
[0035] 该具体实施方式,在应用到如WIFI和蓝牙等主要用于短距离无线通信的应用场景中时,能够支持普通单声道和双声道立体声生成低频效果通道,增强了用户体验,同时,能够使用最低码率编码和传输LFE音频,节省了算力和带宽需求。
[0036] 具体的,本申请的主要实际应用场景如表1:
[0037]
[0038] 表1
[0039] 其中,表1中的有无LFE声道是指原始音频中是否包含LFE声道信号,如常规的单声道或双声道立体声中不包含LFE声道音频,而2.1、5.1和7.1等立体声或环绕声中包含LFE声道信号。表1中的有无重低音是指音频播放设备是否具备播放重低音能力,如常见的蓝牙机和部分立体声音箱是不具备重低音播放能力的,而部分立体声音箱和多声道环绕声音箱具有重低音播放能力。
[0040] 根据表1所示,本申请在进行编码前先获取音频播放设备的重低音播放能力和判断音频是否包含低频效果声道,并根据音频播放设备的重低音播放能力对音频采用不同的编码方法,即在音频播放设备具有重低音播放能力时,对音频中的重低音声道音频按照改进的编码方法进行编码。在音频播放设备不具有重低音播放能力时,计算音频的虚拟低音,并将虚拟低音叠加至原有声道上,将处理后的音频按照L2HC编码标准进行编码。
[0041] 在图1所示的实施方式中,支持低频增强的音频编码方法包括判断步骤S101,获取音频播放设备的重低音播放能力参数和音频的低频效果声道参数,并根据重低音播放能力参数对音频采用不同的编码方法。
[0042] 该步骤通过判断音频播放设备是否具有重低音播放能力和音频中是否包含具有低频效果声道音频,采用不同的编码方法,能够实现针对不同情况采用不同的编码方法,能够解决按照现有编码方法编码低频效果声道造成的频谱泄露和音质降低,以及无法通过常见的单声道音频或双声道立体声音频生成低频效果声道的问题。
[0043] 在图1所示的实施方式中,支持低频增强的音频编码方法包括第一编码步骤S102,在音频播放设备具有重低音播放能力时,根据低频效果声道参数,将音频中的低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到音频对应的码流。
[0044] 该步骤通过修改现有的编码器对LFE声道进行编码的编码方法,能够提高编码效率、避免频谱泄露,进一步提高用户体验感受。
[0045] 图2是本申请一种支持低频增强的音频编码方法的第一编码步骤的流程图。如图2所示,在进行编码前先根据判断音频是否包含低频声道的低频效果声道参数,判断是否需要从音频中提取低频信号,即在音频中包含低频声道时,直接将音频信号通过低延迟改进型离散余弦变换,转换为单声道音频谱系数;在音频中不包含低频声道时,进一步判断音频信号的声道个数,并在音频信号是单声道音频时同样将音频信号直接通过低延迟改进型离散余弦变换,转换为单声道音频谱系数,而在音频中不包含低频声道且为多声道的音频时,需要将音频进行下混处理,得到单声道的音频,然后再进行低延迟改进型离散余弦变换处理。
[0046] 将通过低延迟改进型离散余弦变换处理得到的单声道音频谱系数进行低通滤波,从而得到具有低频效果的频谱系数,然后依次通过信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到具有低频效果的音频码流。
[0047] 其中,对于信号自适应分析处理步骤,其在按照现有标准进行编码的编码器中,会执行带宽分析,从而检测出当前信号的有效带宽,以实现最佳的比特分配同时避免后续编码造成的频谱泄露。但本申请的信号自适应分析处理步骤无需执行带宽分析,这是因为标准的带宽分析能检测到的最小子带数量是16,而本申请在执行完低通滤波后有效带宽为前4个子带,再进行带宽分析处理会造成算力浪费。在实际应用中本申请的信号自适应分析处理步骤的示例如下:设置子带数量bandNum为16,选择低码率子带划分表,并选择子带划分方式索引sfId为0,此时的子带划分方式为:{0,1,2,3,4,6,8,10,13,16,20,24,28,33,38,
45,52,61,70,79,88,100,112,127,142,160,178,196,217,238,259,280,480}。
[0048] 对于频带扩展编码处理步骤,其是根据音频信号的高低频带的关系提取频带扩展边信息,并在解码端由低频信息重建高频信息。现有编码过程采用频带扩展编码的目的是节省码率,且此技术在AAC+等编解码器中得到广泛使用,被证明能够较大的降低码率同时对音质影响较小。本申请的LFE音频因为只有低频信息,所以不需要执行频带扩展,即编码器直接输出频带扩展开关标志为0,即不使能频带扩展。
[0049] 对于频域噪声整形参数获取处理步骤,本申请在实际处理时根据L2HC标准对具有低频效果的音频谱系数选择MdctSns2标准,以减少计算量。
[0050] 对于MDCT系数量化、熵编码、残余编码和位流复用等处理,本申请所采用的处理方法与现有编码过程的处理方法相同。
[0051] 在本申请的一个具体实施例中,第一编码步骤包括:当音频中不包含低频效果声道时,通过从音频中提取低频信号,并将低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到音频对应的码流;其中,从音频中提取低频信号的过程,包括:在音频是双声道音频或多声道音频时,通过将音频进行下混处理,得到音频对应的低频信号。
[0052] 具体的,在不包含低频效果声道的音频是双声道时,通过 公式执行音频的下混处理,得到包含低频信息的单声道的音频。其中,xL(n)代表音频的左声道,xR(n)代表音频的右声道。
[0053] 其中,当音频为三声道等多声道音频时,其进行下混处理的方式与双声道音频的处理方式相似此处不再赘述。
[0054] 在本申请的一个具体实施例中,第一编码步骤包括:通过将单声道音频、具有低频效果声道音频和完成下混处理的音频,利用非对称时延窗函数,进行离散余弦变换,得到低频音频谱系数。
[0055] 具体的,通过将单声道音频、具有低频效果声道的音频和完成下混处理的音频进行以下处理,得到低频音频谱系数。其具体的处理公式为:
[0056] t(n)=x(Z‑NF+n),for n=0…2·NF‑1‑Z
[0057] t(2NF‑Z+n)=0,for n=0…Z‑1
[0058]
[0059] 其中,x(n)是不具有低频效果的单声道音频、已完成下混的多声道音频的下混结果或包含LFE声道的音频,w(n)是非对称低时延窗函数,X(k)是经过改进型离散余弦变换转化后输出的单声道频域谱系数,NF是一音频的谱系数长度,以帧长为10ms、采样率为48kHz为例,NF的值为480。
[0060] 在本申请的一个具体实施例中,第一编码步骤包括:在进行低通滤波之后进行离散余弦变换处理,或在进行低通滤波之后进行离散余弦变换处理;其中,当在进行低通滤波之后进行离散余弦变换处理时,利用低频音频谱系数中的预定个数个低频音频谱系数进行滤波处理,得到低频音频谱系数对应的滤波音频谱系数。
[0061] 具体的,本申请的低通滤波可以在时域进行,即在进行MDCT之前进行,也可以在频域进行,即在进行MDCT之后,本申请不限制低通滤波的具体滤波顺序,
[0062] 当在进行低通滤波之后进行离散余弦变换处理时,能够实现利用MDCT的结果降低算法的复杂度。即通常具有低频效果音频的有效带宽为80‑120Hz,因此,通过利用MDCT转换结果的单声道音频谱系数的前4个谱系数,即可得到具有低频效果的音频谱系数。其公式如下所示:
[0063]
[0064] 其中,XLFE(k)表示具有低频效果的音频谱系数,X(k)表示单声道音频谱系数。
[0065] 在本申请的一个具体实施例中,第一编码步骤包括:设定编码过程中的编码码率为最低码率,并设定低码率标识符为1。
[0066] 具体的,在进行编码时设定编码的码率为最低码率64kbps,设定编码的低码率标识符lowBrFlag为1。通过上述方式能够减少计算量,LFE音频的带宽很窄,因此最低码率即可满足需求,而采用较大的码率则会造成算力浪费和带宽浪费。
[0067] 在图1所示的实施方式中,支持低频增强的音频编码方法包括第二编码步骤S103,在音频播放设备不具有重低音播放能力时,根据低频效果声道参数,生成音频对应的虚拟低音,并将虚拟低音叠加到音频的原始声道上,以及,利用完成叠加的音频进行L2HC编码。
[0068] 在本申请的一个具体实施例中,第二编码步骤包括:在音频中不包含具有低频效果声道音频时,通过将音频中的基频部分滤除,并将剩余各次谐波的叠加,生成音频对应的虚拟低音。
[0069] 该方法通过利用“基音缺失”现象,对输入扬声器的音频信号进行处理,使得扬声器所播放的音频增加了基音对应的谐波成分,并利用扬声器在谐波频段的重放能力较强的优势,可以从用户的主观听觉上改善扬声器的低频表现力,给用户更好的使用体验。
[0070] 具体的,很多电子设备,如笔记本电脑、手机、游戏机等设备其扬声器体积小且低频重低音播放能力差,这会影响用户体验。而在心理声学实验中,存在着一种被称为“虚拟音调”的现象,即对于复音信号,其基频成分决定了信号音调的高低,但将复音信号的基频部分滤除时,余下的各次谐波的叠加依然能使人感受到相同的音调高低,即人耳能在基频缺失情况下利用谐波组合重建信号音调高低。基于上述原理,本申请在音频播放设备不具有重低音播放能力时,通过生成虚拟低音使用户体验到低音的效果。
[0071] 图3是本申请一种支持低频增强的音频编码方法的第二编码步骤的流程图,如图3所示,首先判断音频信号中是否包含具有低频效果的声道,在音频是包含LFE声道的音频时,直接根据音频中的低频信息生成虚拟低音;在音频是不包含LFE声道的音频时,利用带通滤波器滤除音频中20Hz以下和120Hz以上的音频信息,从而提取得到低频信息。利用如MaxxBass和VB Phase Vocoder等方法,对音频的低频信息进行处理,得到虚拟低音。然后,将生成的虚拟低音与例如单声道、双声道或多声道的原始声道进行叠加,得到具有虚拟低音的新的声道信号,并对新的声道信号使用L2HC进行编码,得到音频码流。
[0072] 图4示出了本申请一种支持低频增强的音频编码装置的具体实施方式。
[0073] 在图4所示的具体实施方式中,支持低频增强的音频编码装置主要包括:判断模块401,用于获取音频播放设备的重低音播放能力参数和音频的低频效果声道参数,并根据重低音播放能力参数对音频采用不同的编码方法;
[0074] 第一编码模块402,用于在音频播放设备具有重低音播放能力时,根据低频效果声道参数,将音频中的低频信号通过离散余弦变换、低通滤波、信号自适应性分析、频带扩展编码、频域噪声整形参数获取、离散余弦变换谱系数量化、熵编码、残余编码和位流复用的处理,得到音频对应的码流;
[0075] 第二编码模块403,用于在音频播放设备不具有重低音播放能力时,根据低频效果声道参数,生成音频对应的虚拟低音,并将虚拟低音叠加到音频的原始声道上,以及,利用完成叠加的音频进行L2HC编码。
[0076] 在本申请的一个具体实施例中,第一编码模块402包括:在音频是双声道音频或多声道音频时,通过将音频进行下混处理,得到音频对应的低频信号。
[0077] 在本申请的一个具体实施例中,第一编码模块402包括:通过将单声道音频、具有低频效果声道音频和完成下混处理的音频,利用非对称时延窗函数,进行离散余弦变换,得到低频音频谱系数。
[0078] 在本申请的一个具体实施例中,第一编码模块402包括:在进行低通滤波之后进行离散余弦变换处理,或在进行低通滤波之后进行离散余弦变换处理;其中,当在进行低通滤波之后进行离散余弦变换处理时,利用低频音频谱系数中的预定个数个低频音频谱系数进行滤波处理,得到低频音频谱系数对应的滤波音频谱系数。
[0079] 在本申请的一个具体实施例中,第一编码模块402包括:设定编码过程中的编码码率为最低码率,并设定低码率标识符为1。
[0080] 在本申请的一个具体实施例中,第二编码模块403包括:在音频中不包含具有低频效果声道音频时,通过将音频中的基频部分滤除,并将剩余各次谐波的叠加,生成音频对应的虚拟低音。
[0081] 本申请提供的支持低频增强的音频编码装置,可用于执行上述任一实施例描述的支持低频增强的音频编码方法,其实现原理和技术效果类似,在此不再赘述。
[0082] 在本申请的一个具体实施例中,本申请一种支持低频增强的音频编码装置中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
[0083] 软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD‑ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
[0084] 处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
[0085] 在本申请的另一个具体实施方式中,一种计算机可读存储介质,其存储有计算机程序/指令,计算机程序/指令被操作以执行上述实施例中描述的支持低频增强的音频编码方法。
[0086] 在本申请的一个具体实施方式中,一种计算机设备,包括存储器、处理器以及存储在存储器上的计算机程序,处理器执行计算机程序以实现上述实施例中描述的支持低频增强的音频编码方法。
[0087] 在本申请的一个具体实施方式中,一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述实施例中描述的支持低频增强的音频编码方法。
[0088] 在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0089] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0090] 以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
QQ群二维码
意见反馈