首页 / 国际专利分类库 / 物理 / 乐器;声学 / 用于使用能量限制操作产生频率增强信号的装置及方法

用于使用能量限制操作产生频率增强信号的装置及方法

申请号 CN201480019085.6 申请日 2014-01-28 公开(公告)号 CN105229738B 公开(公告)日 2019-07-26
申请人 弗劳恩霍夫应用研究促进协会; 发明人 萨沙·迪施; 拉尔夫·盖尔; 克里斯蒂安·赫尔姆里希; 马库斯·穆赖特鲁斯; 康斯坦丁·施密特;
摘要 一种用于产生 频率 增强 信号 (130)的装置,包含:信号产生器(200),其用于从核心信号(120)产生增强信号,该增强信号包含不包括在该核心信号中的增强 频率范围 ,其中,该增强信号的时间部分包含用于多个次频带的次频带信号;合成 滤波器 组(300),其用于使用增强信号(130)产生频率增强信号(140),其中,信号产生器(200)被配置为用于执行 能量 限制,以便确保由合成 滤波器组 (300)获得的频率增强信号(140)使得较高频带的能量至多等于较低频带中能量或比较高频带中的能量至多大预定 阈值 。
权利要求

1.一种用于产生频率增强信号(140)的装置,包含:
信号产生器(200),用于从核心信号(120)产生增强信号(130),该增强信号(130)包含不包括在该核心信号(120)中的增强频率范围,其中,该增强信号(130)的时间部分包含用于单个次频带或多个次频带的一个或多个次频带信号;
合成滤波器组(300),用于使用该增强信号(130)产生该频率增强信号(140),其中,该信号产生器(200)被配置为用于执行能量限制,使得该合成滤波器组(300)获得的该频率增强信号(140)使得较高频带的能量至多等于较低频带中的能量或比该较低频带中的能量至多大预定阈值
其中,该信号产生器被配置为基于以下等式在该能量限制中执行限制操作:
其中,fac为该预定阈值,fac针对每个次频带为常数或取决于频谱矩心,其中, 为次频带信号的在由f指示的该次频带处的经能量限制的实数部分,其中, 为在次频带f中的能量限制之后的次频带信号的对应虚数部分,其中,limFac为限制因子,其中,Ef为当前次频带的能量,且Ef-1为具有较低中心频率的次频带的能量,或者
其中,该信号产生器(200)被配置为:检查该增强信号(130)的第一次频带中的第一次频带信号;检查该增强信号(130)的在频率上邻近于该第一次频带且中心频率高于该增强信号(130)的该第一次频带的中心频率的第二次频带中的第二次频带信号;且当该增强信号(130)的该第二次频带的能量等于该增强信号(130)的该第一次频带信号的能量或当该第二次频带信号的能量比该增强信号(130)的该第一次频带信号的能量大的量少于该预定阈值时,不能量限制该增强信号(130)的该第二次频带信号,或者
其中,该信号产生器(200)被配置为在该能量限制(208)之前执行频谱成形(204)或时间平滑(206),其中,该信号产生器(200)被配置为以第一时间分辨率(320)执行该能量限制,其中,以第二时间分辨率执行该频谱成形(204),或其中,以第三时间分辨率执行该时间平滑(206),其中,该第一时间分辨率等于该第二时间分辨率,或其中该第三时间分辨率高于该第一时间分辨率。
2.根据权利要求1所述的装置,
其中,该信号产生器(200)被配置为使用3dB或更小的阈值、或者从描述该核心信号(120)中的能量的频谱分布的值导出的阈值作为该预定阈值。
3.根据权利要求1所述的装置,
其中,该信号产生器(200)被配置为按序列执行与该能量限制的操作(208)不同的多个处理操作(202,204,206),并且
其中,该信号产生器(200)被配置为在该多个处理操作(202,204,206)的序列的结尾处执行该能量限制的操作(208)以获得该增强信号(130),并且
其中,该合成滤波器组(300)被配置为接收由该能量限制的操作产生的该增强信号(130)作为输入。
4.根据权利要求1所述的装置,
其中,该信号产生器(200)被配置为在该能量限制(208)之前执行频谱成形(204)或时间平滑(206)。
5.根据权利要求1所述的装置,
其中,该信号产生器被配置为通过镜像(202)该核心信号(120)的多个次频带来产生该增强信号的多个该次频带信号。
6.根据权利要求5所述的装置,
其中,该信号产生器被配置为基于以下等式执行该镜像:
Qr(t,xover+f-1)=-Qr(t,xover-f);f=1..nBands
Qi(t,xover+f-1)=Qi(t,xover-f);f=1..nBands,
其中,Qr(t,f)为次频带信号在时间索引t及次频带索引f处的实数值,其中,Qi(t,f)为次频带信号在该时间索引t及该次频带索引f处的虚数值,其中,xover为参考交越频率(420)的次频带,并且其中,nBands为待重建构的整数个频带。
7.根据权利要求1所述的装置,
其中,具有较低中心频率的该次频带邻近于该当前次频带。
8.根据权利要求1所述的装置,
其中,该装置被配置为在不使用参数旁侧信息的情况下执行非导引式频率增强,该参数旁侧信息描述不包括在该核心信号中的该增强频率范围。
9.根据权利要求4所述的装置,
其中,该信号产生器(200)被配置为使用关于滤波器组域中的当前的频谱矩心的信息来执行该频谱成形(204)。
10.根据权利要求5所述的装置,
其中,该信号产生器(200)被配置为使用从该核心信号或该增强信号(130)的多个该次频带信号计算的相同平滑信息来执行该增强信号(130)或该核心信号的多个该次频带的该时间平滑(206)。
11.一种产生频率增强信号(140)的方法,包含:
从核心信号(120)产生(200)增强信号(130),该增强信号(130)包含不包括在该核心信号中的增强频率范围,其中,该增强信号(130)的时间部分包含用于单个次频带或多个次频带的一个或多个次频带信号;
通过合成滤波器组使用该增强信号(130)产生(300)该频率增强信号(140),其中,该产生(200)包含执行能量限制,使得由该合成滤波器组(300)获得的该频率增强信号(140)使得较高频带的能量至多等于较低频带中的能量或比该较低频带中的能量至多大预定阈值,
其中,该能量限制中的限制操作基于以下等式:
其中,fac为该预定阈值,fac针对每个频带为常数或取决于频谱矩心,其中, 为次频带信号的在由f指示的该次频带处的经能量限制的实数部分,其中, 为在次频带f中的能量限制之后的次频带信号的对应虚数部分,其中,limFac为限制因子,其中,Ef为当前次频带的能量,且Ef-1为具有较低中心频率的次频带的能量,或者
其中,产生(200)该增强信号(130)包括:检查该增强信号(130)的在频率上邻近于第一次频带且中心频率高于该增强信号(130)的该第一次频带的中心频率的第二次频带中的第二次频带信号;且当该增强信号(130)的该第二次频带的能量等于该增强信号(130)的该第一次频带信号的能量或当该第二次频带信号的能量比该增强信号(130)的该第一次频带信号的能量大的量少于该预定阈值时,不能量限制该增强信号(130)的该第二次频带信号,或者
其中,产生(200)该增强信号(130)包括在该能量限制(208)之前执行频谱成形(204)或时间平滑(206),以第一时间分辨率(320)执行该能量限制,其中,以第二时间分辨率执行该频谱成形(204),或其中,以第三时间分辨率执行该时间平滑(206),其中,该第一时间分辨率等于该第二时间分辨率,或其中该第三时间分辨率高于该第一时间分辨率。
12.一种用于处理音频信号的系统,包含:
编码器(1500),用于从该音频信号中产生经编码核心信号(110);以及
如权利要求1至10中任一项所述的用于从根据该经编码核心信号(110)导出的解码核心信号(120)中产生频率增强信号(140)的装置。
13.一种处理音频信号的方法,包含:
从该音频信号中产生(1500)经编码核心信号(110);以及
使用如权利要求11所述的方法从根据该经编码核心信号(110)导出的解码核心信号(120)中产生频率增强信号(140)。
14.一种计算机可读介质,其上存储有计算机程序,用于当在计算机或处理器上运行时执行如权利要求11或权利要求13所述的方法。

说明书全文

用于使用能量限制操作产生频率增强信号的装置及方法

技术领域

[0001] 本发明基于音频编码,并且具体基于诸如带宽扩展、频谱带复写或智能间隙填充的频率增强程序。
[0002] 本发明尤其与非导引式频率增强(non-guided frequency enhancement)程序相关,亦即,其中译码器侧在不具有旁侧信息或仅具有最少量旁侧信息的情况下操作。

背景技术

[0003] 感知音频编码译码器常常仅量化和编码音频信号的整个可感知频率范围的低通部分,尤其在以(相对)低比特率操作时如此。尽管此方法保证了经编码低频信号的可接受质量,但大多数接听者感知到作为质量降级的高通部分的遗漏。为了克服此问题,可通过带宽扩展方案来合成遗漏的高频部分。
[0004] 目前最先进的编码译码器常常使用波形保持编码器(诸如,AAC)或参数编码器(诸如,语音编码器)以编码低频信号。此等编码器操作直至某一终止频率。此频率被称作交越频率(crossover frequency)。低于该交越频率的频率部分被称作低频带。借助于带宽扩展方案合成的高于交越频率的信号被称作高频带。
[0005] 带宽扩展通常借助于所传输信号(低频带)及额外旁侧信息来合成遗漏的带宽(高频带)。若应用于低比特率音频编码的领域中,则额外信息应尽可能少地消耗额外比特率。因此,通常为额外信息选择参数表示。以相对低的比特率从编码器传输此参数表示(导引式带宽扩展),抑或在译码器处基于特定信号特性估计此参数表示(非导引式带宽扩展)。在后一状况下,该等参数完全不消耗比特率。
[0006] 高频带的合成通常由以下两个部分组成:
[0007] 1.高频内容的产生。可藉由将低频内容(的部分)向上复制或翻转至高频带抑或将白色或成形噪声或其他人工信号部分插入至高频带中来进行此产生。
[0008] 2.根据参数信息对所产生高频内容的调整。此调整包括根据参数表示对形状、调性/噪度及能量的操纵。
[0009] 合成程序的目标通常为实现在感知上接近原始信号的信号。若此目标无法达到,则经合成部分应最小程度地扰乱接听者。
[0010] 不同于导引式BWE方案,非导引式带宽扩展不可依赖于额外信息来合成高频带。实情为,非导引式带宽扩展通常使用经验规则以利用低频带与高频带之间的相关性。大多数音乐段及有声语音片段展现高频带与低频带之间的高度相关性,而对于无声或摩擦语音片段通常并非如此状况。摩擦音在较低频率范围中具有极少能量,而在高于某一频率的范围中具有高能量。若此频率接近交越频率,则产生高于交越频率的人工信号会成问题,因为在该状况下,低频带含有很少的相关信号部分。为了解决此问题,对此等声音的良好检测是有帮助的。
[0011] HE-AAC为熟知的编码译码器,其由用于低频带的波形保持编码译码器(AAC)及用于高频带的参数编码译码器(SBR)组成。在译码器侧,通过使用QMF滤波器组将经译码AAC信号变换至频域中来产生高频带信号。随后,将低频带信号的次频带向上复制至高频带(产生高频内容)。接着基于所传输的参数旁侧信息调整此高频带信号的频谱包络、音调及噪声底限(调整所产生的高频内容)。由于此方法使用导引式BWE方法,因此高频带与低频带之间的弱相关性大体上不成问题,且可藉由传输适当参数集来克服。然而,此传输需要额外比特率,此情形对于给定应用情形可能为不可接受的。
[0012] ITU标准G.722.2为仅在时域中操作(亦即,不在频域中执行任何计算)的语音编码译码器。此译码器以12.8kHz的采样率输出时域信号,该采样率随后被增加取样至16kHz。高频内容(6.4至7.0kHz)的产生基于插入带通噪声。在大多数操作模式下,在不使用任何旁侧信息的情况下进行噪声的频谱成形,仅在具有最高比特率的操作模式下,才在位流中传输关于噪声能量的信息。出于简单性原因且由于并非所有应用情形皆可负担得起额外参数集的传输,在下文中仅描述不使用任何旁侧信息的高频带信号的产生。
[0013] 为了产生高频带信号,按比例调整噪声信号以具有与核心激励信号相同的能量。为了将更多能量给予信号的无声部分,计算频谱倾斜量e:
[0014]
[0015] 其中,s为具有400Hz的截止频率的经高通滤波的经译码核心信号。n为样本索引。在较少能量存在于高频处的有声片段的状况下,e逼近1,而对于无声片段,e接近零。为了在高频带信号中具有更多能量,对于无声语音,将噪声的能量乘以(1-e)。最终,通过滤波器对经按比例调整的噪声信号进行滤波,该滤波器系藉由在线频谱频率(LSF)域中外插而从核心线性预测编码(LPC)滤波器导出。
[0016] 完全在时域中操作的来自G.722.2的非导引式带宽扩展具有以下缺点:
[0017] 1.所产生的HF内容基于噪声。此情形在HF信号与音调、谐波低频信号(例如,音乐)组合的情况下产生听得见的伪讯。为了避免此等伪讯,G.722.2竭限制所产生的HF信号的能量,这也限制带宽扩展的潜在益处。因此,不幸地是,也限制了声音的亮度的最大可能改良或语音信号的可理解度的最大可获得的增加。
[0018] 2.由于此非导引式带宽扩展在时域中操作,因此滤波器操作引起额外算法延迟。此额外延迟降低在双向通信情形中的用户体验的质量,或给定通信技术标准的要求条款可能不允许此额外延迟。
[0019] 3.而且,由于在时域中执行信号处理,因此滤波器操作倾向于具有不稳定性。此外,时域滤波器具有高计算复杂度。
[0020] 4.由于仅将高频带信号的能量的总和调适至核心信号的能量(且进一步藉由频谱倾斜量加权),因此在核心信号(恰好低于交越频率的信号)的较高频率范围与高频带信号之间的交越频率处可存在显著区域能量失配。举例而言,对于在极低频率范围中展现能量集中但在较高频率范围中含有很少能量的音调信号,将尤其为如此状况。
[0021] 5.此外,估计在时域表示中的频谱斜率为计算上复杂的。在频域中,可极有效率地进行频谱斜率的外插。由于(例如)摩擦音的大多数能量集中于高频范围中,因此若应用如G.722.2中的守恒能量及频谱斜率估计策略(参见1.),则此等摩擦音可听起来沉闷。
[0022] 为了进行概述,先前技术非导引式或盲带宽扩展方案可要求译码器侧上的显著计算复杂度,且尤其对于诸如摩擦音的有问题语音,仍导致有限的音频质量。此外,尽管导引式带宽扩展方案提供较好音频质量且有时需要译码器侧上的较低计算复杂度,但由于关于高频带的额外参数信息可需要大量关于经编码核心音频信号的额外比特率的事实,导引式带宽扩展方案不能提供实质的比特率减少。

发明内容

[0023] 因此,本发明的目标为提供用于在非导引式频率增强技术的背景中的音频处理的改良概念。
[0024] 此目标通过以下各项达成:用于产生频率增强信号的装置、用于产生频率增强信号的方法、包含编码器及用于产生频率增强信号的装置的系统、处理音频信号的方法或计算机可读介质。
[0025] 本发明提供频率增强方案,诸如用于音频编码译码器的带宽扩展方案。此方案旨在扩展音频编码译码器的带宽,此扩展不需要额外旁侧信息或仅需要与如在导引式带宽扩展方案中的遗漏频带的全参数描述相比显著减少的最少量旁侧信息。
[0026] 一种用于产生频率增强信号的装置包含:计算器,其用于计算描述核心信号中的关于频率的能量分布的值。用于产生包含不包括于核心信号中的增强频率范围的增强信号的信号产生器使用核心信号来操作,且接着执行增强信号或核心信号的成形,使得增强信号的频谱包络取决于描述能量分布的值。
[0027] 因此,基于描述能量分布的该值使增强信号的包络或增强信号成形。可易于计算此值,且此值接着界定增强信号的完整包络形状或完整形状。因此,译码器可以低复杂度操作,且同时获得良好音频质量。具体而言,当用于频率增强信号的频谱成形时,核心信号中的能量分布导致良好音频质量,即使计算关于能量分布(诸如,核心信号中的频谱矩心)的值及基于此频谱矩心调整增强信号的处理为直接的且可藉由低计算资源执行的程序亦如此。
[0028] 此外,此程序允许分别自核心信号的绝对能量及斜率(滚降)导出高频带信号的绝对能量及斜率(滚降)。优选地在频域中执行此等操作使得可以计算上有效率的方式执行这些操作,因为频谱包络的成形等效于简单地将频率表示与增益曲线相乘,且此增益曲线从描述核心信号中的关于频率的能量分布的值导出。
[0029] 此外,在时域中精确地估计及外插给定频谱形状为计算上复杂的。因此,优选地在频域中执行此等操作。摩擦音(例如)通常在低频处仅具有少量能量,且在高频处具有大量能量。该能量的升高取决于实际摩擦音,且可能在仅稍低于交越频率处开始。在时域中,难以检测此情形且自其获得有效外插为计算上复杂的。对于非摩擦音,可确保人工产生的频谱的能量始终随频率上升而下降。
[0030] 在另一方面中,应用时间平滑程序。提供用于自核心信号产生增强信号的信号产生器。增强信号或核心信号的时间部分包含用于多个次频带的次频带信号。提供用于计算用于增强频率范围的多个次频带信号的相同平滑信息的控制器,且接着由信号产生器使用此平滑信息以用于使增强频率范围的多个次频带信号平滑,尤其使用相同平滑信息,或替代地,当在高频产生之前执行平滑时,则全部使用相同平滑信息来使核心信号的多个次频带信号平滑。此时间平滑避免了自低频带继承至高频带的较小快速能量波动的继续,且因此导致更令人愉悦的感知印象。低频带能量波动通常由会导致不稳定性的基础核心编码器的量化误差引起。由于平滑取决于信号的(长期)稳定性,因此平滑为信号自适应性的。此外,将同一平滑信息用于所有个别次频带确保时间平滑不会改变次频带之间的一致性。实情为,以相同方式使所有次频带平滑,且从所有次频带或仅从在增强频率范围中的次频带导出平滑信息。因此,与个别地对每一次频带信号进行个别平滑相比,获得显著较好的音频质量。
[0031] 另一方面与执行能量限制相关,优选地在用于产生增强信号的整个程序结尾处执行。提供用于从核心信号产生增强信号的信号产生器,其中增强信号包含不包括在核心信号中的增强频率范围,其中增强信号的时间部分包含用于一个或多个次频带的次频带信号。提供用于使用增强信号产生频率增强信号的合成滤波器组,其中信号产生器被配置为用于执行能量限制,以便确保由合成滤波器组获得的频率增强信号使得较高频带的能量至多等于较低频带中的能量或比较低频带中的能量大至多预定阈值。此情形可适用于单个扩展频带。接着,使用最高核心频带的能量进行比较或能量限制。此情形亦可适用于多个扩展频带。接着,使用最高核心频带对最低扩展频带进行能量限制,且相对于次最高扩展频带对最高扩展频带进行能量限制。
[0032] 此程序对非导引式带宽扩展方案尤其有用,但亦可有助于导引式带宽扩展方案,因为非导引式带宽扩展方案倾向于具有由不自然地伸出(尤其在具有负频谱倾斜量的片段处)的频谱分量引起的伪讯。此等分量可能导致高频噪声丛发。为了避免此情形,较佳在处理结尾处应用能量限制,其限制随频率的能量增量。在实施中,在QMF(正交镜像滤波)次频带k处的能量不得超过在QMF次频带k-1处的能量。可基于时隙执行此能量限制或为了减小复杂度仅每一次地执行此能量限制。因此,确保可避免在带宽扩展方案中的任何不自然情形,因为较高频带具有多于较低频带的能量或较高频带的能量比较低频带中的能量高预定阈值(诸如,3dB的阈值)以上为极不自然的。通常,所有语音/音乐信号具有低通特性,亦即,具有随频率或多或少单调减小的能量内容。此情形可适用于单个扩展频带。接着,使用最高核心频带之的量进行比较或能量限制。此情形亦可适用于多个扩展频带。接着,使用最高核心频带对最低扩展频带进行能量限制,且相对于次最高扩展频带对最高扩展频带进行能量限制。
[0033] 尽管可个别地且彼此单独地执行频率增强信号的成形、频率增强次频带信号的时间平滑及能量限制的技术,但也可在较佳非导引式频率增强方案内一起执行此等程序。
[0034] 此外,参考从属权利要求(其参考特定实施方式)。附图说明
[0035] 随后相对于附图来描述本发明的优选实施方式,其中:
[0036] 图1示出了包含使频率增强信号成形、使次频带信号平滑及能量限制的技术的实施方式;
[0037] 图2a-图2c示出了图1的信号产生器的不同实施;
[0038] 图3示出了各个时间部分,其中帧具有长时间部分且时隙具有短时间部分,且每个帧包含多个时隙;
[0039] 图4示出了频谱图,其指示在带宽扩展应用的实施中的核心信号及增强信号的频谱位置
[0040] 图5示出了用于基于描述核心信号的能量分布的值使用频谱成形来产生频率增强信号的装置;
[0041] 图6示出了成形技术的实施;
[0042] 图7示出了根据某一频谱矩心判定的不同滚降;
[0043] 图8示出了用于产生频率增强信号的装置,该频率增强信号包含用于使核心信号或频率增强信号的次频带信号平滑的相同平滑信息;
[0044] 图9示出了由图8的控制器及信号产生器应用的较佳程序;
[0045] 图10示出了由图8的控制器及信号产生器应用的另一程序;
[0046] 图11示出了用于产生频率增强信号的装置,其在增强信号中执行能量限制程序使得增强信号的较高频带可至多具有邻近较低频带的相同能量或比邻近较低频带的能量高至多预定阈值;
[0047] 图12a示出了增强信号在限制之前的频谱;
[0048] 图12b示出了在限制之后的图12a的频谱;
[0049] 图13示出了在实施中由信号产生器执行的程序;
[0050] 图14示出了在滤波器组域内成形、平滑及能量限制的技术的同时应用;及[0051] 图15示出了包含编码器及非导引式频率增强译码器的系统。

具体实施方式

[0052] 图1示出了在较佳实施中的用于产生频率增强信号140的装置,其中一起执行成形、时间平滑及能量限制的技术。然而,也可单独地应用此等技术,如在图5至图7的背景下针对成形技术所论述的、在图8至图10的背景下针对平滑技术所论述的及在图11至图13的背景下针对能量限制技术所论述的。
[0053] 优选地,图1的用于产生频率增强信号140的装置包含分析滤波器组或核心译码器100,或用于在核心译码器输出QMF次频带信号时在滤波器组域中(诸如,在QMF域中)提供核心信号的任何其他器件。或者,当核心信号为时域信号或在不同于频谱或次频带域中的任何其他域中加以提供时,分析滤波器组100可为QMF滤波器组或另一分析滤波器组。
[0054] 接着将在120处可用的核心信号110的各个次频带信号输入至信号产生器200中,且信号产生器200的输出为增强信号130。该增强信号130包含不包括在核心信号110中的增强频率范围,且信号产生器(例如)并非藉由(仅)使噪声成形或因此而是使用核心信号110或较佳核心信号次频带120来产生此增强信号。合成滤波器组接着组合核心信号次频带120与频率增强信号130,且合成滤波器组300接着输出频率增强信号。
[0055] 基本上,信号产生器200包含指示为“HF产生”的信号产生区202,其中HF代表高频。然而,图1中的频率增强不限于产生高频的技术。实情为,亦可产生低频或中间频率,且甚至可在核心信号中再生频谱缺陷,亦即,当核心信号具有较高频带及较低频带且当存在遗漏中间频带的情况,如(例如)自智能间隙填充(IGF)已知的。信号产生202可包含如自HE-AAC已知的向上复制程序,或镜像程序,亦即,其中为了产生高频范围或频率增强范围,将核心信号镜像而非向上复制。
[0056] 此外,信号产生器包含成形功能性204,其由用于计算指示核心信号120中的关于频率的能量分布的值的计算来控制。此成形可为对由区块202产生的信号的成形,或在功能性202与204之间的次序反转(如在图2a至图2c的背景中所论述的)时,替代地为对低频的成形。
[0057] 另一功能性为时间平滑功能性206,其由平滑控制器800控制。优选地在程序结尾处执行能量限制208,但亦可将能量限制置于处理功能性202至208的链中的任何其他位置处,只要确保以下情形即可:由合成滤波器组300输出的组合信号满足能量限制准则,诸如较高频带不得具有比邻近较低频带多的能量,或与邻近较低频带相比,较高频带不得具有更多能量,其中将增量限制为至多预定阈值(诸如,3dB)。
[0058] 图2a示出了不同次序,其中在执行HF产生202之前一起执行成形204与时间平滑206及能量限制208。因此,核心信号经成形/平滑/限制,且接着已完成的经成形/平滑/限制信号经向上复制或镜像至增强频率范围中。此外,重要地是理解到可以任何方式执行区块
204、206、208的次序,如在将图2a与图1中的对应区块的次序相比时亦可见的。
[0059] 图2b示出了以下情形:对低频或核心信号运行时间平滑及成形,且接着在能量限制208之前执行HF产生202。此外,图2c示出了以下情形:对低频信号执行信号的成形,且执行(诸如)藉由向上复制或镜像进行的后续HF产生,以便获得增强频率范围之信号,且接着对此信号进行平滑206及能量限制208。
[0060] 此外,将强调:成形、时间平滑及能量限制的功能性皆可藉由将某些因子应用于次频带信号来执行(如(例如)图14中所说明)。对于各个频带i、i+1、i+2,藉由乘法器1402a、1401a及1400a实施成形。
[0061] 此外,藉由乘法器1402b、1401b及1400b运行时间平滑。另外,对于各个频带i+2、i+1及i,藉由限制因子1402c、1401c及1400c执行能量限制。归因于在此实施方式中藉由乘法因子实施所有此等功能性的事实,将注意到,亦可针对每一个别频带藉由单一乘法因子
1402、1401、1400将所有此等功能性应用于个别次频带信号,且对于频带i+2,此单一“主”乘法因子则将为个别因子1402a、1402b及1402c的乘积,且对于其他频带i+1及i,此情形将类似。因此,接着将次频带的实数/虚数次频带样本值乘以此单一“主”乘法因子,且在区块
1402、1401或1400的输出处获得作为经相乘之实数/虚数次频带样本值的输出,接着将该等样本值引入至图1的合成滤波器组300中。因此,区块1400、1401或1402的输出对应于通常涵盖不包括于核心信号中的增强频率范围的增强信号1300。
[0062] 图3示出了指示用于信号产生程序中的不同时间分辨率的图表。基本上,逐帧处理信号。这意味着较佳地实施分析滤波器组100以产生次频带信号的时间后续帧320,其中次频带信号的每一帧320包含一个或多个时隙或滤波器组时隙340。尽管图3示出了每帧四个时隙,但每帧亦可存在2个、3个或甚至多于四个的时隙。如图14中所示出的,将基于核心信号的能量分布的增强信号或核心信号的成形每帧执行一次。另一方面,以高时间分辨率来运行时间平滑,亦即,较佳为每时隙340一次,且在需要低复杂度时可再次将能量限制每帧执行一次,或在对于特定实施而言较高复杂度不成问题时每时隙执行一次。
[0063] 图4示出了在核心信号频率范围中具有五个次频带1、2、3、4、5的频谱的表示。此外,图4中的实例在增强信号范围中具有四个次频带信号或次频带6、7、8、9,且核心信号范围及增强信号范围由交越频率420分离。此外,示出了开始频带410,其用于为了达成成形204的目的计算描述关于频率的能量分布的值,如稍后将论述的。此程序确保一个或多个最低次频带不用于计算描述关于频率的能量分布的值,以便获得较好的增强信号调整。
[0064] 随后,说明使用核心信号产生202不包括于核心信号中的增强频率范围的实施。
[0065] 为了产生高于交越频率的人工信号,通常将来自低于交越频率的频率范围的QMF值向上复制(“贴补”)至高频带中。可藉由仅将QMF样本自较低频率范围向上移位至高于交越频率的区域或藉由另外镜像此等样本来进行此复制操作。镜像的优点在于:恰好低于交越频率的信号及人工产生的信号将在交越频率处具有极其类似的能量及谐波结构。镜像或向上复制可应用于核心信号的单个次频带或核心信号的多个次频带。
[0066] 在该QMF滤波器组的状况下,经镜像的区带(patch)优选地由基频带的负复共轭组成,以便最小化转变区中的次频带映频混扰:
[0067] Qr(t,xover+f-1)=-Qr(t,xover-f);f=1..nBands
[0068] Qi(t,xover+f-1)=Qi(t,xover-f);f=1..nBands
[0069] 此处,Qr(t,f)为QMF在时间索引t及次频带索引f处的实数值,且Qi(t,f)为虚数值,xover为参考交越频率的QMF次频带,nBands为待外插的整数个频带。实数部分中的负号表示负共轭复数运算。
[0070] 较佳地,HF产生202或大体上增强频率范围的产生依赖于由区块100提供的次频带表示。较佳地,用于产生频率增强信号的本发明装置应为多带宽译码器,其能够对经译码信号110进行重新取样以使取样频率变化,从而支持(例如)窄频带、宽带带及超宽带带输出。因此,QMF滤波器组100将经译码时域信号取作输入。藉由在频域中填补零,QMF滤波器组可用以对经译码信号进行重新取样,且相同QMF滤波器组较佳亦用以产生高频带信号。
[0071] 较佳地,用于产生频率增强信号的装置可操作为执行频域中的所有操作。因此,藉由将区块100指示为已提供(例如)QMF滤波器组域输出信号的“核心译码器”,在译码器侧处已具有内部频域表示的现有系统得到扩展,如图1中所示出的。
[0072] 此表示被简单地重新使用于额外任务,如采样率转换及较佳在频域中进行的其他信号操纵(例如,插入经成形的舒适噪声、高通/低通滤波)。因此,不需要计算额外时间-频率变换。
[0073] 替代将噪声用于HF内容,在此实施方式中仅基于低频带信号产生高频带信号。此产生可借助于频域中之向上复制或向上折迭(镜像)操作来进行。因此,确保了与低频带信号具有相同的谐波及时间精细结构的高频带信号。此情形避免对时域信号的计算成本高的折迭及额外延迟。
[0074] 随后,在图5、图6及图7的背景中论述图1的成形204技术的功能性,其中可在图1、图2a至图2c的背景中执行成形或分离地且单独地与自其他导引式或非导引式频率增强技术已知的其他功能性一起执行成形。
[0075] 图5示出了用于产生频率增强信号140的装置,其包含用于计算描述核心信号120中的关于频率的能量分布的值的计算器500。此外,信号产生器200被配置为用于自核心信号产生增强信号(如由线502所示出的),该增强信号包含不包括于核心信号中的增强频率范围。此外,信号产生器200被配置为用于使(诸如)在图1中的由区块202输出的增强信号或在图2a的背景中的核心信号120成形,使得增强信号的频率包络取决于描述能量分布的值。
[0076] 较佳地,该装置另外包含组合器300,其用于组合由区块200输出的增强信号130与核心信号120以获得频率增强信号140。较佳地执行诸如时间平滑206或能量限制208的额外操作以进一步处理经成形信号,但此等操作在某些实施中未必为需要的。
[0077] 信号产生器200被配置为使增强信号成形,使得对于描述能量分布的第一值,获得自增强频率范围中的第一频率至增强频率范围中的第二较高频率的第一频谱包络减小。此外,对于描述第二能量分布的第二值,获得自增强范围中的第一频率至增强范围中的第二频率的第二频谱包络减小。若第二频率大于第一频率且第二频谱包络减小大于第一频谱包络减小,则与描述核心信号的较低频率范围处的能量集中的第二值相比,第一值指示核心信号在核心信号的较高频率范围处具有能量集中。
[0078] 较佳地,计算器500被配置为将当前帧的频谱矩心的度量计算为关于能量分布的信息值。接着,信号产生器200根据频谱矩心的此度量而进行成形,使得与较低频率处的频谱矩心相比,较高频率处的频谱矩心导致频谱包络的更浅斜率。
[0079] 关于核心信号的在第一频率处开始且在高于第一频率的第二频率处结束的频率部分而计算由能量分布计算器500计算的关于能量分布的信息。第一频率低于核心信号中的最低频率,如(例如)图4中在410处所说明。较佳地,第二频率为交越频率420,但视情况亦可为低于交越频率420的频率。然而,将用于计算频谱分布的度量的第二频率尽可能地扩展至交越频率420为较佳的,且导致最好的音频质量。
[0080] 在实施方式中,由能量分布计算器500及信号产生器200来应用图6的程序。在步骤602中,针对核心信号的每一频带计算以E(i)指示的能量值。接着,在区块604中,计算用于调整增强频率范围的所有频带的单一能量分布值,诸如sp。接着,在步骤606中,使用此单个值针对增强频率范围的所有频带计算加权因子,其中加权因子较佳地为attf。
[0081] 接着,在由信号产生器208执行的步骤608中,将加权因子应用于次频带样本的实数及虚数部分。
[0082] 藉由在QMF域中计算当前帧的频谱矩心来检测摩擦音。频谱矩心为具有0.0至1.0的范围的度量。高频谱矩心(接近一的值)意味着声音的频谱包络具有上升斜率。对于语音信号,这意味着当前帧很可能含有摩擦音。频谱矩心的值愈逼近一,则频谱包络的斜率愈陡,或愈多能量集中于较高频率范围中。
[0083] 根据下式来计算频谱矩心:
[0084]
[0085] 其中E(i)为QMF次频带i的能量,且start为参考1kHz的QMF次频带索引。用因子attf来对经复制QMF次频带加权:
[0086]
[0087] 其中att=0.5*sp+0.5。大体上,可使用以下方程式计算att:
[0088] att=p(sp),
[0089] 其中p为多项式。较佳地,该多项式具有次数1:
[0090] att=a*sp+b,
[0091] 其中a、b或大体上多项式系数皆在0与1之间。
[0092] 除以上等式外,亦可应用具有相当效能的其他等式。这些其他等式如下:
[0093]
[0094] 详言之,值ai应使得i较高则该值较高,且重要地,至少对于索引i>1,值bi低于值ai。因此,与以上等式相比,藉由不同方程式,但获得类似结果。大体上,ai、bi为随i单调增加或减小的值。
[0095] 此外,参看图7。图7示出了用于不同能量分布值sp的个别加权因子attf。当sp等于1时,则核心信号的全部能量集中于核心信号的最高频带处。接着,att等于1,且加权因子attf在频率上恒定,如700处所说明。另一方面,当核心信号中的全部能量集中于核心信号的最低频带处时,则sp等于0且att等于0.5,且调整因子在频率上的对应趋向(course)在
706处说明。
[0096] 在702及704处指示的成形因子在频率上的趋向用于相应地增加频谱分布值。因此,对于项目704,能量分布值大于0,但小于项目702的能量分布值,如由参数箭头708所指示。
[0097] 图8示出了用于使用时间平滑技术产生频率增强信号的装置。该装置包含用于自核心信号120、110产生增强信号的信号产生器200,其中增强信号包含不包括在核心信号中的增强频率范围。增强信号或核心信号的当前时间部分(诸如,帧320及较佳地,时隙340)包含用于多个次频带的次频带信号。
[0098] 控制器800用于针对增强频率范围或核心信号的多个次频带信号计算相同平滑信息802。此外,信号产生器200被配置为用于使用相同平滑信息802使增强频率范围的多个次频带信号平滑,或用于使用相同平滑信息802使核心信号的多个次频带信号平滑。在图8中,信号产生器200的输出为平滑增强信号,可接着将平滑增强信号输入至组合器300中。如在图2a至图2c的背景中所论述的,可在图1的处理链中的任何处执行平滑206,或甚至可在任何其他频率增强方案的背景中个别地执行平滑206。
[0099] 控制器800较佳地被配置为使用多个次频带信号核心信号及频率增强信号的组合能量或仅使用时间部分的频率增强信号来计算平滑信息。此外,使用核心信号及频率增强信号的多个次频带信号的平均能量或仅使用在当前时间部分之前的一或多个较早时间部分的核心信号的平均能量。平滑信息为用于所有频带中的增强频率范围的多个次频带信号的单个校正因子,且因此信号产生器200被配置为将校正因子应用于增强频率范围的多个次频带信号。
[0100] 如在图1的背景中所论述的,该装置此外包含滤波器组100或用于提供用于多个时间后续滤波器组时隙的核心信号的多个次频带信号的提供器。此外,信号产生器被配置为使用核心信号的多个次频带信号导出用于多个时间后续滤波器组时隙的增强频率范围的多个次频带信号,且控制器800被配置为针对每一滤波器组时隙计算个别平滑信息802,且接着藉由新的个别平滑信息针对每一滤波器组时隙执行平滑。
[0101] 控制器800被配置为基于当前时间部分的核心信号或频率增强信号且基于一或多个先前时间部分来计算平滑强度控制值,且控制器800接着被配置为使用平滑控制值计算平滑信息,使得平滑强度取决于以下两者之间的差而变化:当前时间部分的核心信号或频率增强信号的能量,及一或多个先前时间部分的核心信号或频率增强信号的平均能量。
[0102] 参看图9,其示出了由控制器800及信号产生器200执行的程序。由控制器800执行的步骤900包含得出关于平滑强度的决策,其可(例如)基于当前时间部分中的能量与一或多个先前时间部分中的平均能量之间的差而得出,但亦可使用用于作出关于平滑强度的决策的任何其他程序。一种替代例为使用(替代性地或另外地)未来时隙。另一替代例为每帧仅进行单一变换且将接着在时间后续帧上进行平滑。然而,此两个替代例皆会引入延迟。此情形在延迟并非问题的应用(诸如,串流传输应用)中不成问题。对于延迟成问题的应用,诸如对于双向通信(例如,使用移动电话),过去或先前的帧比未来帧更佳,因为使用过去的帧不会引入延迟。
[0103] 接着,在步骤902中,基于步骤900的平滑强度的决策来计算平滑信息。此步骤902亦由控制器800执行。接着,信号产生器200执行904,其包含将平滑信息应用于若干频带,其中将同一平滑信息802应用于在核心信号抑或增强频率范围中的此等若干频带。
[0104] 图10示出了实施图9的步骤序列的较佳程序。在步骤1000中,计算当前时隙的能量。接着,在步骤1020中,计算一个或多个先前时隙的平均能量。接着,在步骤1040中,基于由区块1000及1020获得的值之间的差来判定用于当前时隙的平滑系数。接着,步骤1060包含计算用于当前时隙的校正因子,且步骤1000至1060皆由控制器800执行。接着,在由信号产生器200执行的步骤1080中,执行实际平滑操作,亦即,将对应校正因子应用于一个时隙内的所有次频带信号。
[0105] 在实施方式中,在两个步骤中执行时间平滑:
[0106] 关于平滑强度的决策。为了得到关于平滑强度的决策,评估信号随时间的稳定性。执行此评估的可能方式为比较当前短期窗口或QMF时隙的能量与先前短期窗口或QMF时隙的平均能量值。为了减小复杂度,可仅针对高频带部分来评估此稳定性。所比较的能量值愈接近,则平滑强度应愈低。此情形反映于平滑系数a中,其中0
[0107] 将平滑应用于高频带。基于QMF时隙将平滑应用于高频带部分。因此,将当前时隙的高频带能量Ecurrt调适至一或多个先前QMF时隙的平均高频带能量Eavgt:
[0108]
[0109] 将Ecurr计算为一个时隙中的高频带QMF能量的总和:
[0110]
[0111] Eavg为能量的随时间的移动平均值:
[0112]
[0113] 其中start及stop为用于计算移动平均值的间隔的边界。
[0114] 将用于合成的实数及虚数QMF值乘以校正因子currFac:
[0115]
[0116]
[0117] currFac系自Ecurr及Eavg导出:
[0118]
[0119] 因子a可固定或取决于Ecurr及Eavg的能量差。
[0120] 如图14中所论述的,将用于时间平滑的时间分辨率设定为高于成形的时间分辨率或能量限制技术的时间分辨率。此情形确保获得次频带信号的时间平滑趋向,同时计算上更密集的成形将每帧仅执行一次。然而,不执行自一个次频带至另一次频带(亦即,在频率方向上)的任何平滑,因为已发现此平滑实质上降低主观接听质量。
[0121] 较佳将相同平滑信息(诸如,校正因子)用于增强范围中的所有次频带。然而,亦可实施以下情形:并不将相同平滑信息应用于所有频带,而是应用于频带群组,其中此群组具有至少两个次频带。
[0122] 图11示出了针对图1中所说明的能量限制技术208的另一方面。具体而言,图11示出了用于产生频率增强信号的装置,该装置包含用于产生增强信号的信号产生器200,该增强信号包含不包括于核心信号中的增强频率范围。此外,增强信号的时间部分包含用于多个次频带的次频带信号。另外,该装置包含用于使用增强信号130产生频率增强信号140的合成滤波器组300。
[0123] 为了实施能量限制程序,信号产生器200被配置为用于执行能量限制,以便确保由合成滤波器组300获得的频率增强信号140使得较高频带的能量至多等于较低频带中的能量或比较低频带中的能量大至多预定阈值。
[0124] 信号产生器可较佳地实施为确保较高QMF次频带k不得超过QMF次频带k-1处的能量。然而,信号产生器200亦可实施为允许某一增量,其较佳地可具有3dB的阈值,且阈值可较佳为2dB且甚至更佳为1dB或甚至更小。对于每一频带,预定阈值可为常数,或预定阈值可取决于先前计算的频谱矩心。较佳相关性为:当矩心逼近较低频率(亦即,变小)时,阈值变小,而矩心愈逼近较高频率或sp逼近1,则阈值可变大。
[0125] 在另一实施中,信号产生器200被配置为检查第一次频带中的第一次频带信号且检查在频率上邻近于第一次频带且中心频率高于第一次频带的中心频率的第二次频带中的次频带信号,且当第二次频带信号的能量等于第一次频带信号的能量或当第二次频带信号之能量比第一次频带信号的能量大的量少于预定阈值时,信号产生器将不限制第二次频带信号。
[0126] 此外,信号产生器被配置为按序列形成多个处理操作,如(例如)图1或图2a至图2c中所说明。接着,信号产生器较佳地在序列结尾处执行能量限制,以获得输入至合成滤波器组300中的增强信号130。因此,合成滤波器组300被配置为接收在序列结尾处由能量限制的最终程序产生的增强信号130作为输入。
[0127] 此外,信号产生器被配置为在能量限制之前执行频谱成形204或时间平滑206。
[0128] 在较佳实施方式中,信号产生器200被配置为藉由镜像核心信号的多个次频带来产生增强信号的多个次频带信号。
[0129] 对于镜像,较佳地执行使实数部分抑或虚数部分变负的程序,如较早所论述的。
[0130] 在另一实施方式中,信号产生器被配置为用于计算校正因子limFac,且接着如下将此限制因子limFac应用于核心或增强频率范围的次频带信号:
[0131] 令Ef为一个频带的在时间跨度stop-start上平均的能量:
[0132]
[0133] 若此能量超过先前频带的平均能量达某一位准,则将此频带的能量乘以校正/限制因子limFac:
[0134] 若Ef>fac*Ef-1,则
[0135]
[0136] 且藉由下式校正实数及虚数QMF值:
[0137]
[0138]
[0139] 该因子或预定阈值fac可对于每一频带为常数,或该因子或预定阈值可取决于先前计算的频谱矩心。
[0140] 为在由f指示的次频带处的次频带信号的经能量限制的实数部分。 为在次频带f中的能量限制之后的次频带信号的对应虚数部分。
[0141] Qrt,f及Qit,f为在能量限制之前的次频带信号(诸如,直接在不执行任何成形或时间平滑时的次频带信号,或经成形及时间平滑之次频带信号)的对应实数及虚数部分。
[0142] 在另一实施中,使用以下等式计算限制因子limFac:
[0143]
[0144] 在此等式中,Elim为限制能量,其通常为较低频带的能量或递增某一阈值fac的较低频带的能量。Ef(i)为当前频带f或i的能量。
[0145] 参看图12a及图12b,其示出了在增强频率范围中存在七个频带的某一实例。在能量方面,频带1202大于频带1201。因此,如自图12b变得显而易见,频带1202经能量限制,如在图12b中对于此频带在1250处指示。此外,频带1205、1204及1206皆大于频带1203。因此,所有三个频带经能量限制,如图12b中示出为1250。剩余的仅有非限制频带为频带1201(此为重建构范围中的第一频带)以及频带1203及1207。
[0146] 如所概括,图12a/图12b示出了存在较高频带不得具有比较低频带多的能量的限制的情形。然而,若将允许某一增量,则该情形将看起来略有不同。
[0147] 能量限制可适用于单一扩展频带。接着,使用最高核心频带之能量进行比较或能量限制。此情形亦可适用于多个扩展频带。接着,使用最高核心频带对最低扩展频带进行能量限制,且相对于次最高扩展频带对最高扩展频带进行能量限制。
[0148] 图15示出了传输系统,或大体上包含编码器1500及译码器1510的系统。该编码器较佳为用于产生经编码核心信号的编码器,该编码器执行带宽减少或大体上删除原始音频信号1501中的若干频率范围,该等频率范围未必必须为完整较高频率范围或较高频带,而是亦可为在核心频带之间的任何频带。接着,在无任何旁侧信息的情况下将经编码核心信号自编码器1500传输至译码器1510,且译码器1510接着执行非导引式频率增强以获得频率增强信号140。因此,可如图1至图14中的任一者中所论述的来实施译码器。
[0149] 尽管已在区块表示实际或逻辑硬件组件的方块图的背景中描述本发明,但亦可藉由计算机实施的方法来实施本发明。在后一状况下,区块表示对应方法步骤,其中此等步骤代表由对应逻辑或实体硬件区块执行的功能性。
[0150] 尽管已在装置的背景中描述了一些方面,但显而易见,这些方面也表示对应方法的描述,其中区块或器件对应于方法步骤或方法步骤的特征。类似地,在方法步骤的背景中描述的方面也表示对应装置的对应区块或项目或特征的描述。可藉由(或使用)如(例如)微处理器、可编程计算机或电子电路的硬件装置来执行方法步骤中的一些或全部。在一些实施方式中,可藉由此装置来执行最重要方法步骤中的某一个或多个。
[0151] 本发明所传输的或经编码的信号可存储于数字存储介质上,或可在诸如无线传输介质或有线传输介质(诸如,因特网)的传输介质上加以传输。
[0152] 取决于特定实施要求,可以硬件或以软件来实施本发明的实施方式。可使用例如以下数字存储介质(其上存储有电子可读控制信号)来执行该实施:软性磁盘、DVD、蓝光光盘、CD、ROM、PROM及EPROM、EEPROM或闪存,电子可读控制信号与可编程计算机系统协作(或能够与可编程计算机系统协作)使得执行相应方法。因此,数字存储介质可为计算机可读的。
[0153] 根据本发明的一些实施方式包含具有电子可读控制信号的数据载体,这些电子可读控制信号能够与可编程计算机系统协作使得执行本文中所描述的方法中的一个。
[0154] 大体而言,本发明之实施方式可实施为具有程序代码的计算机程序产品,当该计算机程序产品在计算机上执行时,该程序代码可操作为用于执行方法中的一个。举例而言,该程序代码可存储于机器可读载体上。
[0155] 其他实施方式包含用于执行本文中所描述的方法中的一个、存储于机器可读载体上的计算机程序。
[0156] 换言之,本发明方法的实施方式因此为具有程序代码的计算机程序,当该计算机程序在计算机上执行时,该程序代码用于执行本文中所描述的方法中的一个。
[0157] 本发明方法的另一实施方式因此为数据载体(或诸如数字存储介质或计算机可读介质的非瞬时性存储介质),其包含记录于其上的用于执行本文中所描述的方法中的一个的计算机程序。数据载体、数字储存介质或记录介质通常为有形和/或非瞬时性的。
[0158] 本发明方法的另一实施方式因此为表示用于执行本文中所描述的方法中的一个的计算机程序的数据流或信号序列。举例而言,该数据流或信号序列可被配置为经由数据通信连接(例如,经由因特网)来传送。
[0159] 另一实施方式包含被配置为或用以执行本文中所描述的方法中的一个的处理构件,例如,计算机或可编程逻辑器件
[0160] 另一实施方式包含计算机,其具有安装于其上的用于执行本文中所描述的方法中的一个的计算机程序。
[0161] 根据本发明的另一实施方式包含被配置为将用于执行本文中所描述的方法中的一个的计算机程序传送(例如,以电子方式或光学方式)至接收器的装置或系统。举例而言,接收器可为计算机、移动器件、内存器件或其类似者。举例而言,装置或系统可包含用于将计算机程序传送至接收器的文件服务器
[0162] 在一些实施方式中,可编程逻辑器件(例如,现场可编程阵列)可用以执行本文中所描述的方法的功能性中的一些或全部。在一些实施方式中,现场可编程门阵列可与微处理器协作以便执行本文中所描述的方法中的一个。大体而言,优选地藉由任何硬件装置来执行方法。
[0163] 上述实施方式仅说明本发明的原理。应理解,本文中所描述的配置及细节的修改及变化对于本领域技术人员而言将为显而易见的。因此,旨在仅由待审专利权利要求的范围来限制,而非由借助于本文中的实施方式的描述及解释而呈现的特定细节来限制。
QQ群二维码
意见反馈