确定主标度因子频带表的系统和方法、高频重构单元、音频编
码器和解码器
[0002] 本申请要求于2013年8月29日提交的美国临时申请No. 61/871,575的优先权,该申请的全部内容通过引用被结合于此。
技术领域
[0003] 本文档涉及音频编码和解码。具体而言,本文档涉及使用高频重构(HFR)的音频编码方案。
背景技术
[0004] HFR技术,诸如
频谱带复制(SBR)技术,允许显著提高传统
感知音频编解码器(被称为核心
编码器/解码器)的编码效率。与MPEG-4高级音频编码(AAC)相结合,HFR构成非常高效的音频编解码器,其在例如XM卫星无线电系统和数字无线电世界范围通用标准中使用,并且还在3GPP、DVD论坛及其它当中被标准化。具有SBR的AAC的一种实现被称为杜比脉冲(Dolby Pulse)。具有SBR的AAC是MPEG-4标准的一部分,其中它被称为高效AAC 简档(HE-AAC)。一般而言,HFR技术可以以向后和向前兼容的方式与任何感知音频(核心)编解码器结合,由此提供升级已建立的广播系统,就像在Eureka DAB系统中使用的MPEG层2,的可能性。HFR方法还可以与语音编解码器结合,以允许超低比特率的宽带语音。
[0005] HFR背后的基本思想是
信号的高频范围的特点与同一信号的低
频率范围的特点之间的强相关性存在的观察。因此,对信号的原始输入高频范围的表示的良好近似可以通过从低频范围到高频范围的信号转置来实现。
[0006] 利用
滤波器组或者时域到频域变换,高频重构可以在时域或频域中执行。该过程通常涉及创建高频信号并且随后塑形高频信号以近似原始高频频谱的频谱包络的步骤。创建高频信号的步骤可以,例如,基于单边带调制(SSB),其中频率为ω的正弦曲线被映射到频率为ω+Δω的正弦曲线,其中Δω是固定的频移。换句话说,通过低频子带(也被称为低频带子带)到高频子带(也被称为高频带子带)的“向上复制”操作,高频信号(也被称为高频带信号)可以从低频信号(也被称为低频带信号)生成。另一种创建高频信号的方法可以涉及低频子带的谐波转置。阶次为T的谐波转置通常被设计为将低频信号的频率为ω的正弦曲线映射到高频信号的频率为Tω的正弦曲线,其中T>1。
[0007] 如以上所指示的,在创建高频信号之后,高频信号的频谱包络的形状根据原始
音频信号的高频分量的频谱形状进行调整。为了这个目的,用于多个标度因子(scale factor)频带的标度因子可以从音频编码器发送到音频解码器。本文档解决使音频解码器能够以计算和比特率高效的方式确定标度因子频带(从音频编码器为其提供标度因子) 的技术问题。
发明内容
[0008] 根据一方面,描述了被配置为确定用于音频信号的高频带信号的主标度因子频带表的系统。该系统可以是音频编码器和/或解码器的一部分。主标度因子频带表可以在高频重构,HFR,方案的上下文中被用来从音频信号的低频带信号生成音频信号的高频带信号。主标度因子频带表可以指示高频带信号的频谱包络的频率
分辨率。具体而言,主标度因子频带表可以指示多个标度因子频带。这多个标度因子频带可以与对应的多个标度因子关联,其中标度因子频带的标度因子指示标度因子频带中原始音频信号的
能量或者指示为了生成具有近似标度因子频带内原始音频信号的能量的能量的高频带信号而要应用到标度因子频带的样本的增益因子。这样,多个标度因子和多个标度因子频带提供由主标度因子频带表(或者从其导出的标度因子频带表) 的多个标度因子频带
覆盖的
频率范围内原始音频信号的频谱包络的近似。
[0009] 该系统可以被配置为接收参数集。该参数集可以包括代表预定标度因子频带表中的索引的一个或多个参数(例如,开始频率参数和/ 或
停止频率参数)。此外,该参数集可以包括可以被用来选择多个不同的预定标度因子频带表当中特定的一个的选择参数(例如,主标度参数)。
[0010] 该系统可以被配置为提供预定的标度因子频带表。具体而言,该系统可以被配置为提供多个不同的预定标度因子频带表(例如,高比特率标度因子频带表和低比特率标度因子频带表)。这一个或多个预定的标度因子频带表可以存储在系统的
存储器中。作为替代,这一个或多个预定的标度因子频带表可以利用存储在系统中的预定公式或规则生成(而不需要应用已经由音频编码器生成并发送的参数)。换句话说,包括该系统的音频解码器可以被配置为以自给自足的方式提供一个或多个预定的标度因子频带表(独立于对应的音频编码器)。
[0011] 通常,预定的标度因子频带表当中至少一个标度因子频带包括多个频带。利用时域到频域变换或者
滤波器组(诸如
正交镜像滤波器 (QMF)组),音频信号可以从时域变换到频域。具体而言,音频信号可以对于对应的多个频带(例如,从频带索引0至频带索引63 的64个频带)被变换成多个子带信号。频带可以被分成包括一个、两个、三个、四个或更多个频带的标度因子频带。包括在预定标度因子频带表的标度因子频带中的频带的数量可以随着增大的频率而增大。具体而言,每标度因子频带的频带的数量可以根据心理因素被选择。作为例子,预定的标度因子频带表的标度因子频带可以遵循巴克 (Bark)标度。
[0012] 该系统可以被配置为通过利用所述参数集选择预定标度因子频带表当中的一些或全部标度因子频带来确定主标度因子频带表。具体而言,主标度因子频带表可以通过利用来自该参数集的至少一个参数截断预定标度因子频带表来确定。换句话说,主标度因子频带表可以包括预定标度因子频带表的标度因子频带的子集或全部(根据来自该参数集的至少一个参数)。这样,主标度因子频带表可以专
门包括包含在预定标度因子频带表中的标度因子频带。换句话说,主标度因子频带表可以包括仅取自预定标度因子频带表的标度因子频带。
[0013] 通过使用一个或多个预定的标度因子频带表和参数集来从一个或多个预定的标度因子频带表之一选择一个或多个标度因子频带,(在 HFR方案的上下文中使用的)主标度因子频带表可以以计算高效的方式确定。其结果是,音频解码器的成本可以降低。此外,用于从音频编码器向对应的音频解码器发送参数集的信令开销可以保持小,由此为从音频编码器到音频解码器发信令通知主标度因子频带表提供了比特率高效的方案。这允许参数集以周期性的方式(例如,对于每个音频
帧)被包括到从音频编码器发送到音频解码器的音频比特流中,由此使能广播和/或拼接应用。
[0014] 如以上所指示的,参数集可以包括指示主标度因子频带表中具有主标度因子频带表的标度因子频带的最低频率的标度因子频带的开始频率参数。具体而言,开始频率参数可以指示对应于主标度因子频带表的最低标度因子频带(关于频率是最低的)的频率仓(bin)。开始频率参数可以包括取例如0和7之间的值的3位值。该系统可以被配置为在预定标度因子频带表的较低频率端除去零个、一个或多个标度因子频带,用于确定主标度因子频带表。具体而言,该系统可以被配置为在预定标度因子频带表的较低频率端除去偶数个标度因子频带,其中该偶数是开始频率参数的两倍。这样,开始频率参数可以被用来截断预定的标度因子频带表的较低频率端,以便确定主标度因子频带表。
[0015] 作为替代或附加地,参数集可以包括指示主标度因子频带表中具有主标度因子频带表的标度因子频带的最高频率的标度因子频带的停止频率参数。具体而言,停止频率参数可以指示对应于主标度因子频带表的最高标度因子频带(关于频率是最高的)的频率仓。停止频率参数可以包括取例如0和3之间的值的2位值。该系统可以被配置为在预定标度因子频带表的较高频率端除去零个、一个或多个标度因子频带,用于确定主标度因子频带表。
具体而言,该系统可以被配置为在预定标度因子频带表的较高频率端除去偶数个标度因子频带,其中该偶数是停止频率参数的两倍。这样,停止频率参数可以被用来截断预定的标度因子频带表的较高频率端,以便确定主标度因子频带表。
[0016] 如以上所指示的,该系统可以被配置为提供多个预定的标度因子频带表。这多个预定的标度因子频带表可以包括低比特率标度因子频带表和高比特率标度因子频带表。具体而言,该系统可以被配置为提供确切两个预定的标度因子频带表,即,低比特率标度因子频带表和高比特率标度因子频带表。参数集可以包括指示多个预定的标度因子频带表中(确切)一个的主标度参数,该参数被用来确定主标度因子频带表。具体而言,主标度参数可以包括取例如0和1之间的值的1 位值,例如,以区分低比特率标度因子频带表与高比特率标度因子频带表。为了使HFR方案适应编码的音频比特流的比特率,多个不同的预定标度因子频带表的使用会是有益的。
[0017] 低比特率标度因子频带表可以包括处于比高比特率标度因子频带表的任何一个标度因子频带低的频率的一个或多个标度因子频带。作为替代或附加地,高比特率标度因子频带表可以包括处于比低比特率标度因子频带表的任何一个标度因子频带高的频率的一个或多个标度因子频带。换句话说,低比特率标度因子频带表可以包括从第一低频仓到第一高频仓的一个或多个标度因子频带。这样,低比特率标度因子频带表可以由第一低频仓和第一高频仓界定。以类似的方式,高比特率标度因子频带表可以包括从第二低频仓到第二高频仓的一个或多个标度因子频带。这样,高比特率标度因子频带表可以由第二低频仓和第二高频仓界定。第一低频仓可以处于比第二低频仓低的频率(或可以具有低的索引)。作为替代或附加地,第二高频仓可以处于比第一高频仓高的频率(或可以具有高的索引)。此外,包括在高比特率标度因子频带表中的标度因子频带的数量可以高于包括在低比特率标度因子频带表中的标度因子频带的数量。由此,预定的标度因子频带表可以根据,在相对低比特率的情况下,被低频带信号覆盖的频率范围比相对高比特率的情况下低的观察来设计。此外,预定的标度因子频带表可以根据,在相对高比特率的情况下,比特率与感知
质量之间改进的折衷可以通过扩展高频带信号的频率范围来实现的观察来设计。
[0018] 音频信号的低频带信号和高频带信号可以覆盖总共64个频带 (例如,QMF频带或复数QMF(即CQMF)频带),从频带索引 0至频带索引63。换句话说,频带可以对应于由其频带索引从0至 63的64通道滤波器组生成的频带。低比特率标度因子频带表可以包括以下一些或全部:从频带10至频带20的标度因子频带,每个标度因子频带包括单个频带;从频带20至频带32的标度因子频带,每个标度因子频带包括两个频带;从频带32至频带38的标度因子频带,每个标度因子频带包括三个频带;和/或从频带38至频带46的标度因子频带,每个标度因子频带包括四个频带。高比特率标度因子频带表可以包括以下一些或全部:从频带18至频带24的标度因子频带,每个标度因子频带包括单个频带;从频带24至频带44的标度因子频带,每个标度因子频带包括两个频带;和/或从频带44至频带62的标度因子频带,每个标度因子频带包括三个频带。
[0019] 包括在预定标度因子频带表中的标度因子频带的数量和/或包括在主标度因子频带表中的标度因子频带的数量可以是偶数。这可以通过使用包括偶数个标度因子频带的预定标度因子频带表并且用偶数个标度因子频带截断预定的标度因子频带表来实现。在HFR处理的上下文中,偶数个标度因子频带的使用会是有益的,因为偶数个标度因子频带的使用确保低分辨率频带表将是高分辨率频带表的精确
抽取 (decimation)。
[0020] 该系统可以被配置为基于主标度因子频带表确定高分辨率频带表和低分辨率频带表。高分辨率频带表可以结合相对低的
时间分辨率 (即,包括相对大量样本的帧)使用并且低分辨率频带表可以结合相对高的时间分辨率(即,包括相对少量样本的帧)使用。在这种上下文中,参数集可以包括指示位于主标度因子频带表的较低频率端的、要从高频重构中被排除的零个、一个或多个标度因子频带的交叉频带参数。交叉频带参数可以包括取例如0和3或7之间的值的2或3位值,以指示例如处于主标度因子频带表的较低频率端的、要被排除的 0至3或7个标度因子频带。该系统可以被配置为根据交叉频带参数通过排除位于主标度因子频带表的较低频率端的零个、一个或多个标度因子频带来从主标度因子频带表确定高分辨率频带表和低分辨率频带表。具体而言,高分辨率频带表可以对应于不包括位于主标度因子频带表的较低频率端的、根据交叉频带参数被排除的零个、一个或多个标度因子频带的主标度因子频带表。此外,该系统可以被配置为通过抽取高分辨率频带表(例如,以二为因子)确定低分辨率频带表。这样,预定的标度因子频带表和结果产生的具有偶数个标度因子频带的主标度因子频带表的使用对于以计算高效的方式生成低分辨率频带表会是有益的。
[0021] 应当注意的是,该系统还可以被配置为从主标度因子频带表确定噪声频带表和/或
限幅器频带表(其也可以在HFR方案的上下文中被使用)。此外,用于用在HFR方案中的转置的修补方案可以基于主标度因子频带表和/或基于高和低分辨率频带表来确定。
[0022] 低频带信号和高频带信号可以被分段成包括音频信号的预定数量样本的帧序列。该系统可以被配置为从该帧序列接收用于帧集合的更新的参数集。该帧集合可以包括预定数目的帧(例如,一个、两个或更多个帧)。更新的参数集可以针对每个帧集合接收(以周期性的方式)。如果更新的参数集当中影响主标度因子频带表的一个或多个参数(例如,开始频率参数、停止频率参数和/或主标度参数)保持不变,则该系统可以被配置为维持主标度因子频带表不变。主标度因子频带表可以被用于对该帧集合的所有帧执行HFR方案。另一方面,如果更新的参数集当中影响主标度因子频带表的一个或多个参数(例如,开始频率参数、停止频率参数和/或主标度参数)改变,则该系统可以被配置为确定更新的主标度因子频率表。更新的主标度因子频带表可以被用于对音频信号的所有帧执行HFR方案,直到确定另一个更新的主标度因子频带表(经历
修改的参数集的接收)。这样,通过发送一个或多个影响主标度因子频带表的修改后的参数,即,通过发送例如修改后的开始频率参数、修改后的结束频率参数和/或修改后的主标度因子参数,主标度因子频带表的修改可以以高效的方式被触发。
[0023] 根据另一方面,描述了被配置为从音频信号的低频带信号生成音频信号的高频带信号的高频重构(HFR)单元。高频重构单元可以包括被配置为确定一个或多个低频带子带信号的分析滤波器组(例如, QMF组)。此外,HFR单元可以包括被配置为将一个或多个低频带子带信号转置到高频带频率范围以产生转置的子带信号(例如,利用向上拷贝处理)的转置单元。此外,HFR单元可以包括上述系统,以便确定用于高频带信号的标度因子频带表,其中该标度因子频带表包括覆盖高带频率范围的多个标度因子频带。此外,HFR单元或包括该HFR单元的音频解码器可以包括被配置为接收分别用于多个标度因子频带的多个标度因子的包络调整单元。包络调整单元还可以被配置为根据多个标度因子频带通过多个标度因子加权或缩放转置后的子带信号,以产生缩放的子带信号(也被称为缩放的HFR子带信号)。高频带信号可以基于缩放后子带信号来确定。为了这个目的, HFR单元或包括该HFR单元的音频解码器可以包括被配置为从加权的转置后的频带确定高频带信号的合成滤波器组(例如,逆QMF滤波器组)。具体而言,合成滤波器组可以被配置为从一个或多个低频带子带信号并且从缩放的HFR子带信号确定重构的音频信号(在时域中)。
[0024] 根据另一方面,描述了被配置为从比特流确定重构的音频信号的音频解码器。音频解码器可以包括被配置为通过解码比特流的一部分来确定重构的音频信号的低频带信号的核心解码器(例如,AAC解码器)。此外,音频解码器包括被配置为确定重构的音频信号的高频带信号的高频重构单元。具体而言,以上提到的合成滤波器组可以被用来从得自低频带信号的低频带子带信号并且从缩放的子带信号(代表高频带信号)确定重构的音频信号。
[0025] 根据另一方面,描述了被配置为确定并发送参数集的音频编码器。参数集可以连同指示音频信号的低频带信号的比特流一起发送。参数集可以使对应的音频解码器能够通过利用所述参数集从预定的标度因子频带表选择一些或全部标度因子频带来确定主标度因子频带表。主标度因子频带表可以在高频重构方案的上下文中使用,以便从音频信号的低频带信号生成音频信号的高频带信号。
[0026] 根据另一方面,描述了指示音频信号的低频带信号并指示参数集的比特流。参数集可以使音频解码器能够通过利用该参数集从预定的标度因子频带表中选择一些或全部标度因子频带来确定主标度因子频带表。主标度因子频带表可以在高频重构的上下文中使用,以便从音频信号的低频带信号生成音频信号的高频带信号。
[0027] 根据另一方面,描述了用于确定用于音频信号的高频带信号的主标度因子频带表的方法。高频带信号将利用高频重构方案从音频信号的低频带信号生成。主标度因子频带表可以指示高频带信号的频谱包络的频率分辨率。该方法可以包括接收参数集,并且提供预定的标度因子频带表。预定的标度因子频带表当中至少一个标度因子频带可以包括多个频带。该方法还可以包括(仅仅)通过选择预定的标度因子频带表的一些或全部标度因子频带来确定主标度因子频带表。这样,主标度因子频带表可以仅仅基于选择操作来确定,而不需要进一步的计算。因此,主标度因子频带表可以以计算高效的方式来确定。
[0028] 根据另一方面,描述了
软件程序。该软件程序可以适于在处理器上执行并且当在处理器上执行时适于执行在本文档中概述的方法步骤。
[0029] 根据另一方面,描述了存储介质。该存储介质可以包括适于在处理器上执行并且当在处理器上执行时适于执行在本文档中概述的方法步骤的软件程序。
[0030] 根据另一方面,描述了
计算机程序产品。该计算机程序可以包括当在处理器上执行时适于执行在本文档中概述的方法步骤的可执行指令。
[0031] 应当指出的是,如在本
专利申请中概述的方法和系统,包括其优选
实施例,可以单独地或者与本文档中公开的其它方法和系统结合使用。此外,本专利申请中概述的方法和系统的所有方面可以任意组合。具体而言,
权利要求的特征可以以任意方式彼此组合。
附图说明
[0032] 以下参照附图以示例性的方式解释本发明,其中:
[0033] 图1示出了示例低频带和高频带信号;
[0034] 图2示出了示例标度因子频带表;
[0035] 图3a和3b示出了示例主标度因子频带表的比较;及
[0036] 图4示出了用于利用预定的标度因子频带表生成高频带信号的示例方法。
具体实施方式
[0037] 使用HFR(高频重构)技术的音频解码器通常包括用于从低频音频信号(被称为低频带信号)生成高频音频信号(被称为高频带信号)的HFR单元和用于调整高频音频信号的频谱包络的后续频谱包络调整单元。
[0038] 在图1中,示出了在进入包络调整器之前的HFR单元的输出的示意绘制频谱100、110。在顶部面板中,向上复制方法(有两个片) 被用来从低频带信号101生成高频带信号
105,例如,在MPEG-4 SBR(频谱带复制)中使用的向上复制方法,该方法在“ISO/IEC 14496-
3Information Technology-Coding of audio-visual objects-Part 3:Audio”中概述并通过引用被结合于此。向上复制方法将较低频的部分101转化为较高频105。在下部面板中,谐波转置方法(具有两个非重叠的转置阶)被用来从低频带信号111生成高频带信号115,例如MPEG-D USAC的谐波转置方法,该方法在“MPEG-D USAC: ISO/IEC 23003-3-Unified Speech and Audio Coding”中描述并通过引用被结合于此。在后续的包络调整阶段,目标频谱包络被应用到高频分量105、115。
[0039] 除了频谱100、110,图1还示出了代表目标频谱包络的频谱包络数据的示例频带130。这些频带130被称为标度因子频带或目标间隔。通常,目标能量值,即,标度因子能量(或标度因子),为每个目标间隔,即,为每个标度因子频带,
指定。换句话说,标度因子频带定义目标频谱包络的有效频率分辨率,因为通常每个目标间隔只有单个目标能量值。利用为标度因子频带指定的标度因子或目标能量,后续的包络调整器努
力调整高频带信号,使得标度因子频带内高频带信号的能量对于相应的标度因子频带等于接收到的频谱包络数据的能量,即,目标能量。
[0040] 本文档致力于用于在音频解码器确定频带表(其指示要在HFR 或SBR处理中使用的标度因子频带130)的高效方案。此外,本文档致力于减少用于从音频编码器向对应的音频解码器传送频带表(被称为标度因子频带表)的信令开销。此外,本文档致力于简化音频编码器的调谐。
[0041] 在音频解码器确定频带表(尤其是主标度因子频带表)的可能方法是基于使用已发送到音频解码器的参数的预定义
算法。在运行时,预定的算法被执行,以基于所发送的参数计算频带表。该预定的算法提供所谓的“主表”(也被称为主标度因子频带表)。然后,计算出的“主表”可以被用来导出正确解码并应用对应于高频重构算法的参数化数据所需的表集合(例如,高分辨率频带表、低分辨率频带表、噪声频带表和/或限幅器频带表)。
[0042] 以上提到的用于确定频带表的方案是不利的,因为它需要发送由音频解码器使用来计算“主表”的参数。此外,用于计算“主表”的预定算法的执行要求在音频解码器的计算资源并且因此增大了音频解码器的成本。
[0043] 在本文档中,提出了使用一个或多个预定的、静态的标度因子频带表。具体而言,提出了定义两个静态标度因子频带表,第一个表用于低比特率并且第二个表用于高比特率。然后,音频解码器重构高频带信号105所需的其它的表,包括主表,可以从静态预定义的表导出。其它表(尤其是主标度因子频带表)的导出可以通过利用数据流(也被称为比特流)中从音频编码器发送到音频解码器的参数将预定义的标度因子频带表加索引而以高效的方式完成。
[0044] 第一和第二静态标度因子频带表可以按Matlab记号定义为:
[0045] ●第一个表:
[0046] sfbTableLow=[(10:20)';(22:2:32)';(35:3:38)';(42:4:46)'];及[0047] ●第二个表:
[0048] sfbTableHigh=[(18:24)';(26:2:44)';(47:3:62)'];
[0049] 分别提供标度因子频带分割210和200,如图2中所示(实线)。在以上提到的Matlab记号中,数字指示各个频带220(例如,正交镜像滤波器组(QMF)组或复数值QMF(CQMF)组)。第一个表 (即,低比特率标度因子频带表)在频带10(标号201)开始并上升到频带46(标号
202)。第二个表(即,高比特率标度因子频带表) 在频带18(标号211)开始并上升到频带62(标号212)。这样,第一个表(对于相对低的比特率,例如,低于预定的比特率
阈值)包括[0050] ●从频带10到20的标度因子频带130,其每个都包括单个频带220,[0051] ●从频带20到32的标度因子频带130,其每个都包括两个频带220,[0052] ●从频带32到38的标度因子频带130,其每个都包括三个频带220,及[0053] ●从频带38到46的标度因子频带130,其每个都包括四个频带220。
[0054] 以类似的方式,第二个表(对于相对高的比特率,例如,高于预定的比特率阈值)包括
[0055] ●从频带18到24的标度因子频带130,其每个都包括单个频带220,[0056] ●从频带24到44的标度因子频带130,其每个都包括两个频带220,及[0057] ●从频带44到62的标度因子频带130,其每个都包括三个频带220。
[0058] 如从图2可以看到的,低比特率标度因子频带表200在CQMF 带10开始并上升到频带46,具有多达20个标度因子频带130。高比特率标度因子频带表210支持从频带18到频带62的多达22个标度因子频带130。
[0059] 为了从静态标度因子频带表200、210导出用于进行当前帧解码的主表,可以使用三个参数。这些参数可以从音频编码器发送到音频解码器,以便使音频解码器能够导出用于当前帧的主表(即,为了导出当前主表)。这些参数是:
[0060] 1.开始频率(startFreq)参数:开始频率参数可以具有3位的长度并且可以取0和7之间的值。开始频率参数可以是预定的标度因子频带表200、210中的索引,从相应的标度因子频带表200、210的最低频带201、211(即,频带10 或18)开始,按两个标度因子频带130的步幅向上移动。因此,对于高比特率标度因子频带表210,参数值 startFreq=1将指向频带20。
[0061] 2.停止频率(stopFreq)参数:停止频率参数可以具有2位的长度并且可以取0和4之间的值。停止频率参数可以是标度因子频带表200、210中的索引,从最高频带(46或 62)开始,按两个标度因子频带130的步幅向下移动。因此,在高比特率标度因子频带表210中,参数值stopFreq =2将指向频带50。
[0062] 3.主标度(masterScale)参数。主标度参数可以具有1位的长度并且可以取0和1之间的值。主标度参数可以指示两个预定的标度因子频带表200、210当中哪个目前正在使用。作为例子,参数值masterScale=0可以指示低比特率标度因子频带表200并且参数值masterScale=1可以指示高比特率标度因子频带表210。
[0063] 利用48000Hz的
采样频率,以下表1和2分别列出了用于低比特率标度因子频带表200和用于高比特率标度因子频带表210的可能的开始和停止频带。
[0064]
[0065] 表1,
[0066] 示出了用于低比特率标度因子频带表的开始和停止频率
[0067]
[0068] 表2,
[0069] 示出了用于高比特率标度因子频带表的开始和停止频率
[0070] 利用主标度参数,编码器可以向解码器指示预定的标度因子频带表200、210当中哪一个被用来导出主标度因子频带表。利用开始频率参数和停止频率参数,如在表1和2中所概述的,可以确定实际的主标度因子频带表。作为例子,对于masterScale=0、startFreq=1 且stopFreq=2,主标度因子频带表包括低比特率标度因子频带表 200中范围为从频带12至频率32的标度因子频带。
[0071] 主标度因子频带表可以对应于被用来为音频信号的连续段执行 HFR的高分辨率频带表。低分辨率频带表可以通过抽取高分辨率频带表,例如以2为因子,从主标度因子频带表导出。低分辨率频带表可以被用于音频信号的瞬态段(以允许增大的时间分辨率,以降低的频率分辨率为代价)。从表1和2可以看到,用于高分辨率频带表 210,210的标度因子频带130的数量可以是偶数。因此,低分辨率频带表可以是高分辨率表按因子2的完美抽取。而且,如从表1和2 看到的,频带表总是在偶数编号的CQMF频带220开始和结束。
[0072] 影响当前使用的频带表的第四个参数可以是交叉频带 (xOverBand)参数。交叉频带参数可以具有2或3位的长度并且可以取0和3(7)之间的值。xOverBand参数可以是高分辨率频带表 (或主标度因子频带表)中的索引,在第一个仓开始,以一个标度因子频带130为步幅向上移动。因此,xOverBand参数的使用将有效地截断高分辨率频带表和/或主标度因子频带表的开始。xOverBand 参数可以被用来扩展低频带信号101的频率范围和/或减小高频带信号105的频率范围。由于xOverBand参数通过截断现有的表来改变 HFR带宽,并且尤其是不改变转置修补方案,因此xOverBand参数可以被用来在运行时更改带宽而没有可听的伪像,或者在多通道设置中允许不同的HFR带宽,同时所有通道仍使用相同的修补方案。对于xOverBand参数的一些选择,高和低分辨率频带表的第一标度因子频带将是完全相同的(如在图3b中可以看到的)。
[0073] 图3a和3b示出了基于预定的标度因子频带表200、210导出的主标度因子频带表与利用算法方法导出的主标度因子频带表的比较。图3a示出了22kbps的相对低比特率的情况(单声道/参数化立体声)。图的上半部分300示出了利用静态低比特率标度因子频带表 200导出的主标度因子频带表并且图的下半部分310示出了利用算法方法导出的主标度因子频带表。线301、311代表相应的主标度因子频带表的标度因子频带的边界。下方的菱形302、312代表高分辨率标度因子频带的边界并且上方的菱形303、313代表低分辨率标度因子频带的边界。可以看到,利用静态、预定的标度因子频带表200、 210导出的主标度因子频带表与利用算法方法导出的主标度因子频带表基本相同。
[0074] 图3b示出了比特率为76kb/s的相对高比特率立体声情况。在这种情况下,高比特率标度因子频带表210已被用来确定主标度因子频带表。再次,上面的图320示出了已经利用静态标度因子频带表 210导出的主标度因子频带表,而下面的图330示出了已经利用算法方法导出的主标度因子频带表。线321、331代表相应主标度因子频带表的比例因子频带的边界。下方的菱形322、332代表高分辨率标度因子频带的边界并且上方的菱形323、333代表低分辨率标度因子频带的边界。再次,可以看到,利用静态、预定的标度因子频带表 200、210导出的主标度因子频带表与利用算法方法导出的主标度因子频带表基本相同。
[0075] 在图3b的例子中,xOverBand参数已被设置为不等于零的值。具体而言,xOverBand参数对于算法方法已被设置为2,而 xOverBand参数对于本文档中所描述的方法已被设置为1。作为使用 xOverBand参数的结果,等于xOverBand参数的多个频带324、334 从高分辨率表和低分辨率表中被排除。
[0076] 当前主标度因子频带表(也被称为当前主表)可以通过使用表3 中列出的伪代码由音频解码器导出。
[0077]
[0078] 表3
[0079] 在表3的伪代码中,如果以下任何一个参数从前一帧改变: masterScale参数、startFreq参数和/或stopFreq参数,则参数 masterReset被设置为1。这样,改变的masterScale参数、startFreq 参数和/或stopFreq参数的接收触发新主表在音频解码器的确定。只要确定了新的(更新的)主表(接受改变的主标度、开始频率和/或停止频率参数),就使用当前主表。
[0080] 在表3的伪代码中,masterBandTable是导出的主标度因子频带表并且nMfb是在导出的主标度因子频带表中的标度因子频带的数量。从导出的主标度因子频带表,在HFR过程中使用的所有其它表,例如高和低分辨率频带表、噪声频带表和限幅器频带表,都可以根据传统SBR方法导出,该方法在例如通过引用被结合于此的“ISO/IEC 14496-3Information Technology-Coding of audio-visual objects-Part 3:Audio”中指定。
[0081] 图4示出了用于为音频信号的高频带信号105、115确定主标度因子频带表的示例方法400的
流程图。换句话说,方法400致力于确定在HFR方案的上下文中用来从音频信号的低频带信号101、111 生成高频带信号105,115的主标度因子频带表(也被称为主表)。主标度因子频带表指示高频带信号105、115的频谱包络的频率分辨率。方法400包括接收401参数集的步骤,例如开始频率参数、停止频率参数和/或主标度参数。此外,方法400包括提供402预定的标度因子频带表200、201的步骤。此外,方法400包括通过利用所述参数集选择预定的标度因子频带表200、210的一些或全部标度因子频带130来确定403主标度因子频带表的步骤。
[0082] 在本文档中,描述了用于导出用于HFR的标度因子频带的高效方案。该方案采用一个或多个预定的标度因子频带表,从这些表导出用于HFR(例如,用于SBR)的主标度因子频带表。为了这个目的,参数集被插入到从音频编码器发送到音频解码器的比特流中,由此使音频解码器能够确定主标度因子频带表。主标度因子频带表的确定仅包括表查找操作,由此为确定主标度因子频带表提供了计算高效的方案。此外,被插入到比特流中的参数集可以按比特率高效的方式进行编码。
[0083] 本文档中描述的方法和系统可以被实现为软件、
固件和/或
硬件。某些部件可以,例如,被实现为在
数字信号处理器或
微处理器上运行的软件。其它部件可以,例如,被实现为硬件和/或实现为专用集成
电路。在所描述的方法和系统中遇到的信号可以被存储在诸如
随机存取存储器或光学存储介质的介质上。它们可以经由网络,诸如无线电
电网络、卫星网络、无线网络或有线网络,例如互联网,被传送。使用本文档中所描述的方法和系统的典型设备是便携式
电子设备或者被用来存储和/或呈现音频信号的其它消费设备。