首页 / 专利库 / 信号处理 / 信号 / 音频信号 / 使用基于残差信号调整解相关信号贡献的多声道音频解码器、多声道音频编码器、方法和数据载体

使用基于残差信号调整解相关信号贡献的多声道音频解码器、多声道音频编码器、方法和数据载体

阅读:1041发布:2020-06-21

专利汇可以提供使用基于残差信号调整解相关信号贡献的多声道音频解码器、多声道音频编码器、方法和数据载体专利检索,专利查询,专利分析的服务。并且用于在编码表示的 基础 上提供至少二个输出音频 信号 的多声道音频 解码器 被配置用于执行降混合信号、解相关信号和残差信号的加权组合,以获得输出 音频信号 中的一个。多声道音频解码器被配置用于根据残差信号确定用来描述加权组合中解相关信号的贡献的权重。用于提供多声道音频信号的编码表示的多声道音频 编码器 被配置用于在多声道音频信号的基础上获得降混合信号,并提供用来描述多声道音频信号的声道之间的相依性的参数,以及提供残差信号。多声道音频编码器被配置用于根据多声道音频信号改变被包含至编码表示中的残差信号的数量。,下面是使用基于残差信号调整解相关信号贡献的多声道音频解码器、多声道音频编码器、方法和数据载体专利的具体信息内容。

1.一种用于在编码表示(210;310;710)的基础上提供至少二个输出音频信号(212,
214;312,314;712,714)的多声道音频解码器(200;300;700;800),其特征在于,其中所述多声道音频解码器被配置用于执行降混合信号(222;752,754)、解相关信号(224;756,758)和残差信号(226;760,762)的加权组合(220;780;790;792),以获得所述输出音频信号(212,214;712,714)中的一个,
其中所述多声道音频解码器被配置用于根据所述残差信号确定用来描述所述加权组合中所述解相关信号的贡献的权重(232);
其中所述多声道音频解码器被配置用于根据所述解相关信号确定用来描述所述加权组合中所述解相关信号的所述贡献的所述权重。
2.根据权利要求1所述的多声道音频解码器,其中所述多声道音频解码器被配置用于在所述编码表示的基础上获得升混合参数,并根据所述升混合参数确定用来描述所述加权组合中所述解相关信号的所述贡献的所述权重(232)。
3.根据权利要求1所述的多声道音频解码器,其中所述多声道音频解码器被配置用于确定用来描述所述加权组合中所述解相关信号的所述贡献的所述权重(232),使得所述解相关信号的所述权重随着所述残差信号的能量的增加而减少。
4.根据权利要求1所述的多声道音频解码器,其中所述多声道音频解码器被配置用于确定用来描述所述加权组合中所述解相关信号的所述贡献的所述权重(232),使得如果所述残差信号的能量为零,则解相关信号升混合参数所确定的最大权重关联至所述解相关信号,并且使得如果以残差信号加权系数进行加权的所述残差信号的能量大于或等于以所述解相关信号升混合参数进行加权的所述解相关信号的能量,则零权重关联至所述解相关信号。
5.根据权利要求1所述的多声道音频解码器,其中所述多声道音频解码器被配置用于计算以根据一个或多个解相关信号升混合参数进行加权的所述解相关信号的加权能量值,并计算使用一个或多个残差信号升混合参数进行加权的所述残差信号的加权能量值,以根据所述解相关信号的所述加权能量值和所述残差信号的所述加权能量值来确定因子,并在所述因子的基础上获得用来描述所述解相关信号对于所述输出音频信号中一个的所述贡献的所述权重,或者使用所述因子作为用来描述所述解相关信号对于所述输出音频信号中一个的所述贡献的所述权重。
6.根据权利要求5所述的多声道音频解码器,其中所述多声道音频解码器被配置用于将所述因子乘以解相关信号升混合参数,以获得用来描述所述解相关信号对于所述输出音频信号中一个的所述贡献的所述权重。
7.根据权利要求5所述的多声道音频解码器,其中所述多声道音频解码器被配置用于在多个升混合声道和多个时隙上计算以使用解相关信号升混合参数进行加权的所述解相关信号的所述能量,以获得所述解相关信号的所述加权能量值。
8.根据权利要求5所述的多声道音频解码器,其中所述多声道音频解码器被配置用于在多个升混合声道和多个时隙上计算以使用残差信号升混合参数进行加权的所述残差信号的所述能量,以获得所述残差信号的所述加权能量值。
9.根据权利要求5所述的多声道音频解码器,其中所述多声道音频解码器被配置用于根据所述解相关信号的所述加权能量值和所述残差信号的所述加权能量值之间的差异计算所述因子。
10.根据权利要求9所述的多声道音频解码器,其中所述多声道音频解码器被配置用于根据比例计算所述因子,所述比例介于
所述解相关信号的所述加权能量值和所述残差信号的所述加权能量值之间的差异,和所述解相关信号的所述加权能量值,之间。
11.根据权利要求5所述的多声道音频解码器,其中所述多声道音频解码器被配置用于确定用来描述所述解相关信号对于两个或两个以上输出音频信号的贡献的权重,其中所述多声道音频解码器被配置用于在所述解相关信号的所述加权能量值和第一声道解相关信号升混合参数的基础上,确定所述解相关信号对于第一输出音频信号的贡献,以及
其中所述多声道音频解码器被配置用于在所述解相关信号的所述加权能量值和第二声道解相关信号升混合参数的基础上,确定所述解相关信号对于第二输出音频信号的贡献。
12.根据权利要求1所述的多声道音频解码器,其中所述多声道音频解码器被配置用于如果残差能量超过解相关器能量,则禁止所述解相关信号对于所述加权组合的贡献。
13.根据权利要求1所述的多声道音频解码器,其中所述多声道音频解码器被配置用于根据公式
计算两个输出音频信号ch1及ch2,
其中ch1表示第一输出音频信号的一个或多个时间域样本或者转换域样本,其中ch2表示第二输出音频信号的一个或多个时间域样本或者转换域样本,其中xdmx表示降混合信号的一个或多个时间域样本或者转换域样本;
其中xdec表示解相关信号的一个或多个时间域样本或者转换域样本;
其中xres表示残差信号的一个或多个时间域样本或者转换域样本;
其中udmx,1表示用于所述第一输出音频信号的降混合信号升混合参数;
其中udmx,2表示用于所述第二输出音频信号的降混合信号升混合参数;
其中udec,1表示用于所述第一输出音频信号的解相关信号升混合参数;
其中udec,2表示用于所述第二输出音频信号的解相关信号升混合参数;
其中max表示极大算符;以及
其中r表示根据所述残差信号的用来描述所述解相关信号的权重的因子。
14.根据权利要求13所述的多声道音频解码器,其中所述多声道音频解码器被配置用于根据公式
或根据公式
计算所述因子r,
其中Edec(hb)或Edec表示用于频带hb的所述解相关信号xdec的加权能量值,其中Eres(hb)或Eres表示用于频带hb的所述残差信号xres的加权能量值,以及其中0≤ε≤1e-5。
15.根据权利要求14所述的多声道音频解码器,其中所述多声道音频解码器被配置用于根据公式
计算所述解相关信号的所述加权能量值,
其中udec指派用于频带hb、用于时隙ts和用于升混合声道ch的解相关信号升混合参数,其中xdec表示用于频带hb、用于时隙ts和用于升混合声道ch的解相关信号的时间域样本或转换域样本,
其中 指派升混合声道ch上的总和,以及
其中 指派时隙ts上的总和,
其中||.||指派模算符,
其中所述多声道音频解码器被配置用于根据
计算所述残差信号的所述加权能量值,
其中ures指派用于频带hb、用于时隙ts和用于升混合声道ch的残差信号升混合参数,其中xres表示用于频带hb、用于时隙ts和用于升混合声道ch的解相关信号的时间域样本或者转换域样本。
16.根据权利要求1所述的多声道音频解码器,其中所述音频解码器被配置用于根据所述残差信号的加权能量值的频带化决定,频带化地确定用来描述所述加权组合中所述解相关信号的贡献的所述权重(232)。
17.根据权利要求1所述的音频解码器,其中所述音频解码器被配置用于针对所述输出音频信号的每个,确定用来描述所述加权组合中所述解相关信号的贡献的所述权重。
18.根据权利要求1所述的音频解码器,其中所述多声道音频解码器被配置用于可变化地调整用来描述所述加权组合中所述残差信号的贡献的权重。
19.一种用于在编码表示(210;310;710)的基础上提供至少二个输出音频信号(212,
214;312,314;712,714)的多声道音频解码器(200;300;700;800),其特征在于,其中所述多声道音频解码器被配置用于在降混合信号(222;722)的编码表示、多个编码空间参数(726)和残差信号(226;724)的编码表示的基础上,获得所述输出音频信号中的一个,以及
其中所述多声道音频解码器被配置用于根据所述残差信号在参数编码和残差编码之间进行混合,
使得所述残差信号的强度确定,除了所述降混合信号之外所述解码是否还主要以所述空间参数为基础,或,除了所述降混合信号之外所述解码是否还主要以所述残差信号为基础,或,是否采用中间状态,其中所述空间参数和所述残差信号都影响所述输出信号的细化,以从所述降混合信号获得所述输出音频信号。
20.一种用于提供多声道音频信号(110)的编码表示(112)的多声道音频编码器(100),其特征在于,
其中多声道音频编码器被配置用于在所述多声道音频信号的基础上获得降混合信号(122),
并提供用来描述所述多声道音频信号的所述声道之间的相依性的参数(124),以及提供残差信号(126),
其中所述多声道音频编码器被配置用于根据所述多声道音频信号改变被包含至所述编码表示中的残差信号的数量;
其中所述多声道音频编码器被配置用于针对所述多声道音频信号为音调的频带,选择性地将所述残差信号包含至所述编码表示中。
21.根据权利要求20所述的多声道音频编码器,其中所述多声道音频编码器被配置用于根据所述多声道音频信号改变所述残差信号的带宽。
22.根据权利要求20所述的多声道音频编码器,
其中所述多声道音频编码器被配置用于根据所述多声道音频信号选择所述残差信号被包含至所述编码表示中的频带。
23.根据权利要求20所述的多声道音频编码器,
其中所述多声道音频编码器被配置用于针对时间段和/或针对频带,选择性地将所述残差信号包含至所述编码表示中,其中所述降混合信号的形成导致所述多声道音频信号的信号分量的取消。
24.根据权利要求23所述的多声道音频编码器,
其中所述多声道音频编码器被配置用于检测所述降混合信号中的所述多声道音频信号的信号分量的取消,以及其中所述多声道音频编码器被配置用于响应于所述检测的结果而激发所述残差信号的所述提供。
25.根据权利要求20所述的多声道音频编码器,
其中所述多声道音频编码器被配置用于使用所述多声道音频信号的至少二个声道信号的线性组合,并根据多声道解码器侧的待使用的升混合系数,计算所述残差信号。
26.根据权利要求25所述的多声道音频编码器,其中所述多声道音频编码器被配置用于确定并编码所述升混合系数,
或从用来描述所述多声道音频信号的所述声道之间的相依性的参数获得所述升混合系数。
27.根据权利要求20所述的多声道音频编码器,
其中所述多声道音频编码器被配置用于使用心理声学模型,时变地确定被包含至所述编码表示中的残差信号的所述数量。
28.根据权利要求20所述的多声道音频编码器,
其中所述多声道音频编码器被配置用于根据当前可用的比特率,时变地确定被包含至所述编码表示中的残差信号的所述数量。
29.一种用于在编码表示的基础上提供至少二个输出音频信号的方法(500),其特征在于,所述方法包括:
执行(520)降混合信号、解相关信号和残差信号的加权组合,以获得所述输出音频信号中的一个,
其中根据所述残差信号确定用来描述所述加权组合中所述解相关信号的贡献的权重;
其中根据所述解相关信号确定用来描述所述加权组合中所述解相关信号的所述贡献的所述权重。
30.一种用于在编码表示的基础上提供至少二个输出音频信号的方法(600),其特征在于,所述方法包括:
在降混合信号的编码表示、多个编码空间和残差信号的编码表示的基础上获得(610)所述输出音频信号中的一个,
其中根据所述残差信号执行(620)参数编码和残差编码之间的混合,
使得所述残差信号的强度确定,除了所述降混合信号之外解码是否还主要以所述空间参数为基础,或,除了所述降混合信号之外所述解码是否还主要以所述残差信号为基础,或,是否采用中间状态,其中所述空间参数和所述残差信号都影响所述输出信号的细化,以从所述降混合信号获得所述输出音频信号。
31.一种用于提供多声道音频信号的编码表示的方法(400),其特征在于,所述方法包括:
在所述多声道音频信号的基础上获得(410)降混合信号,
提供(420)用来描述所述多声道音频信号的所述声道之间的相依性的参数;以及提供(430)残差信号;
其中根据所述多声道音频信号改变(440)被包含至所述编码表示中的残差信号的数量;
其中针对所述多声道音频信号为音调的频带,选择性地将所述残差信号包含至所述编码表示中。
32.一种数据载体,包括存储其上的计算机程序,其特征在于,当所述计算机程序运行在计算机上,所述计算机程序用于执行根据权利要求29、30或31所述的方法。
33.一种用于在编码表示(210;310;710)的基础上提供至少二个输出音频信号(212,
214;312,314;712,714)的多声道音频解码器(200;300;700;800),其特征在于,其中所述多声道音频解码器被配置用于执行降混合信号(222;752,754)、解相关信号(224;756,758)和残差信号(226;760,762)的加权组合(220;780;790;792),以获得所述输出音频信号(212,214;712,714)中的一个,
其中所述多声道音频解码器被配置用于根据所述残差信号确定用来描述所述加权组合中所述解相关信号的贡献的权重(232);
其中所述多声道音频解码器被配置用于计算以根据一个或多个解相关信号升混合参数进行加权的所述解相关信号的加权能量值,并计算使用一个或多个残差信号升混合参数进行加权的所述残差信号的加权能量值,以根据所述解相关信号的所述加权能量值和所述残差信号的所述加权能量值来确定因子,并在所述因子的基础上获得用来描述所述解相关信号对于所述输出音频信号中一个的所述贡献的所述权重,或者使用所述因子作为用来描述所述解相关信号对于所述输出音频信号中一个的所述贡献的所述权重。
34.一种用于在编码表示(210;310;710)的基础上提供至少二个输出音频信号(212,
214;312,314;712,714)的多声道音频解码器(200;300;700;800),其特征在于,其中所述多声道音频解码器被配置用于执行降混合信号(222;752,754)、解相关信号(224;756,758)和残差信号(226;760,762)的加权组合(220;780;790;792),以获得所述输出音频信号(212,214;712,714)中的一个,
其中所述多声道音频解码器被配置用于根据所述残差信号确定用来描述所述加权组合中所述解相关信号的贡献的权重;
其中所述多声道音频解码器被配置用于根据公式
计算两个输出音频信号ch1及ch2,
其中ch1表示第一输出音频信号的一个或多个时间域样本或者转换域样本,其中ch2表示第二输出音频信号的一个或多个时间域样本或者转换域样本,其中xdmx表示降混合信号的一个或多个时间域样本或者转换域样本;
其中xdec表示解相关信号的一个或多个时间域样本或者转换域样本;
其中xres表示残差信号的一个或多个时间域样本或者转换域样本;
其中udmx,1表示用于所述第一输出音频信号的降混合信号升混合参数;
其中udmx,2表示用于所述第二输出音频信号的降混合信号升混合参数;
其中udec,1表示用于所述第一输出音频信号的解相关信号升混合参数;
其中udec,2表示用于所述第二输出音频信号的解相关信号升混合参数;
其中max表示极大算符;以及
其中r表示根据所述残差信号的用来描述所述解相关信号的权重的因子。
35.一种用于提供多声道音频信号(110)的编码表示(112)的多声道音频编码器(100),其特征在于,
其中多声道音频编码器被配置用于在所述多声道音频信号的基础上获得降混合信号(122),
并提供用来描述所述多声道音频信号的所述声道之间的相依性的参数(124),以及提供残差信号(126),
其中所述多声道音频编码器被配置用于根据所述多声道音频信号改变被包含至所述编码表示中的残差信号的数量;
其中所述多声道音频编码器被配置用于针对时间段和/或针对频带,选择性地将所述残差信号包含至所述编码表示中,其中所述降混合信号的形成导致所述多声道音频信号的信号分量的取消。
36.一种用于提供多声道音频信号(110)的编码表示(112)的多声道音频编码器(100),其特征在于,
其中多声道音频编码器被配置用于在所述多声道音频信号的基础上获得降混合信号(122),
并提供用来描述所述多声道音频信号的所述声道之间的相依性的参数(124),以及提供残差信号(126),
其中所述多声道音频编码器被配置用于根据所述多声道音频信号改变被包含至所述编码表示中的残差信号的数量;
其中所述多声道音频编码器被配置用于根据当前可用的比特率,时变地确定被包含至所述编码表示中的残差信号的所述数量。
37.一种用于在编码表示的基础上提供至少二个输出音频信号的方法(500),其特征在于,所述方法包括:
执行(520)降混合信号、解相关信号和残差信号的加权组合,以获得所述输出音频信号中的一个,
其中根据所述残差信号确定(510)用来描述所述加权组合中所述解相关信号的贡献的权重;
其中所述方法包括计算以根据一个或多个解相关信号升混合参数进行加权的所述解相关信号的加权能量值,并计算使用一个或多个残差信号升混合参数进行加权的所述残差信号的加权能量值,并根据所述解相关信号的所述加权能量值和所述残差信号的所述加权能量值来确定因子,并在所述因子的基础上获得用来描述所述解相关信号对于所述输出音频信号中一个的所述贡献的所述权重,或者使用所述因子作为用来描述所述解相关信号对于所述输出音频信号中一个的所述贡献的所述权重。
38.一种用于在编码表示的基础上提供至少二个输出音频信号的方法(500),其特征在于,所述方法包括:
执行(520)降混合信号、解相关信号和残差信号的加权组合,以获得所述输出音频信号中的一个,
其中根据所述残差信号确定用来描述所述加权组合中所述解相关信号的贡献的权重;
其中所述方法包括根据公式
计算两个输出音频信号ch1及ch2,
其中ch1表示第一输出音频信号的一个或多个时间域样本或者转换域样本,其中ch2表示第二输出音频信号的一个或多个时间域样本或者转换域样本,其中xdmx表示降混合信号的一个或多个时间域样本或者转换域样本;
其中xdec表示解相关信号的一个或多个时间域样本或者转换域样本;
其中xres表示残差信号的一个或多个时间域样本或者转换域样本;
其中udmx,1表示用于所述第一输出音频信号的降混合信号升混合参数;
其中udmx,2表示用于所述第二输出音频信号的降混合信号升混合参数;
其中udec,1表示用于所述第一输出音频信号的解相关信号升混合参数;
其中udec,2表示用于所述第二输出音频信号的解相关信号升混合参数;
其中max表示极大算符;以及
其中r表示根据所述残差信号的用来描述所述解相关信号的权重的因子。
39.一种用于提供多声道音频信号的编码表示的方法(400),其特征在于,所述方法包括:
在所述多声道音频信号的基础上获得(410)降混合信号,
提供(420)用来描述所述多声道音频信号的所述声道之间的相依性的参数;以及提供(430)残差信号;
其中根据所述多声道音频信号改变(440)被包含至所述编码表示中的残差信号的数量;
其中所述方法包括针对时间段和/或针对频带,选择性地将所述残差信号包含至所述编码表示中,其中所述降混合信号的形成导致所述多声道音频信号的信号分量的取消。
40.一种用于提供多声道音频信号的编码表示的方法(400),其特征在于,所述方法包括:
在所述多声道音频信号的基础上获得(410)降混合信号,
提供(420)用来描述所述多声道音频信号的所述声道之间的相依性的参数;以及提供(430)残差信号;
其中根据所述多声道音频信号改变(440)被包含至所述编码表示中的残差信号的数量;
其中所述方法包括根据当前可用的比特率,时变地确定被包含至所述编码表示中的残差信号的所述数量。

说明书全文

使用基于残差信号调整解相关信号贡献的多声道音频解码

器、多声道音频编码器、方法和数据载体

技术领域

[0001] 根据本发明实施例涉及用于在编码表示的基础上提供至少二个输出音频信号的多声道音频解码器
[0002] 根据本发明的另一实施例涉及用于提供多声道音频信号的编码表示的音频编码器。
[0003] 根据本发明的另一实施例涉及用于在编码表示的基础上提供至少二个输出音频信号的方法。
[0004] 根据本发明的另一实施例涉及用于提供多声道音频信号的编码表示的方法。
[0005] 根据本发明的另一实施例涉及用于执行方法中一个的计算机程序
[0006] 一般来说,根据本发明的部分实施例涉及结合的残差与参数编码。

背景技术

[0007] 近年来,对于音频内容的储存和传输的需求一直在稳步地增加。此外,对于音频内容的储存和传输的质量需求也一直在稳步地增加。从而,对于音频内容的编码和解码的概念也已经被强化。例如,所谓的“高级音频编码(ACC)”已被建立,例如,其在国际标准ISO/IEC13818-7:2003中被描述。
[0008] 此外,部分空间的延伸也已经被建立,例如,所谓的“MPEG环绕”概念,例如,其在国际标准ISO/IEC 23003-1:2007中被描述。此外,对于音频信号的空间信息的编码和解码的附加改进在国际标准ISO/IEC23003-2:2010中被描述,其涉及所谓的空间音频对象编码。此外,灵活的(可切换的)音频编码/解码概念提供了以高效率编码对一般音频信号和语音信号进行编码的可能性,也提供了处理多声道音频信号的可能性,其如定义在国际标准ISO/IEC 23003-3:2012所描述的“统一语音及音频编码”概念中。
[0009] 然而,目前仍然期望能够提供一种对于多声道音频信号的高效率编码/解码的更高级概念。

发明内容

[0010] 根据本发明的实施例建立了用于在编码表示的基础上提供至少两个输出音频信号的多声道音频解码器。多声道音频解码器被配置用于执行降混合信号、解相关信号和残差信号的加权组合,以获得输出音频信号中的一个。多声道音频解码器被配置用于根据残差信号确定用来描述加权组合中残差信号的贡献的权重。
[0011] 根据本发明的该实施例基于以下发现,如果,用来描述降混合信号、解相关信号和残差信号的加权组合中解相关信号的贡献的权重根据残差信号而被调整,则能够在编码表示的基础上非常有效率地获得输出音频信号。从而,通过根据残差信号调整用来描述加权组合中解相关信号的贡献的权重,有可能在没有传输附加控制信息下在参数编码(或主要地参数编码)和残差编码(或主要地残差编码)之间进行混合(或衰退)。此外,还可发现的是,被包含至编码表示中的残差信号是针对权重的良好指示,该权重用来描述加权组合中解相关信号的贡献,一般较佳的作法是,如果残差信号是(相对地)微弱的(或者对于期望能量的再建是不必须的),则在解相关信号上置放(相对地)较高的权重,如果残差信号是(相对地)强大的(或者对于期望能量的再建是必须的),则在解相关信号上置放(相对地)较低的权重。从而,上述提及的概念允许在参数编码(其中,例如,期望能量特征和/或相关特征通过参数信号化以及通过增加解相关信号再建)和残差编码(其中,在部分情况下,残差信号用于再建以输出音频信号,其是降混合信号基础上的输出音频信号的波形)之间的渐近转变。从而,有可能地针对再建和再建的质量而改编该技术,以成为没有附加信号化负担的解码信号。
[0012] 在较佳的实施例中,多声道音频解码器被配置用于根据解相关信号确定用来描述加权组合中解相关信号的贡献的权重。通过根据残差信号和根据解相关信号来确定用来描述加权组合中解相关信号的贡献的权重,权重能够良好地调整至信号特征,使得在编码表示的基础上(特别是,在降混合信号、解相关信号和残差信号的基础上),至少二个输出音频信号的再建可以达到良好的质量。
[0013] 在较佳实施例中,多声道音频解码器被配置用于在编码表示的基础上获得升混合参数,并根据升混合参数确定用来描述加权组合中解相关信号的贡献的权重。通过考虑升混合参数,有可能再建输出音频信号的期望特征(例如,输出音频信号之间的期望相关性,和/或输出音频信号的期望能量特征),以得到期望值。
[0014] 在较佳实施例中,多声道音频解码器被配置用于确定用来描述加权组合中解相关信号的贡献的权重,使得解相关信号的权重随着一个或多个残差信号的能量的增加而减少。该机制允许根据残差信号的能量调整至少二个输出音频信号的再建的精准度。如果残差信号的能量相对地高,则解相关信号的贡献的权重相对地小,使得解相关信号不会长久有害地影响由使用残差信号所造成的再制的高质量。相反地,如果残差信号的能量相对地低,或者甚至为零,高权重被给予至解相关信号,使得解相关信号能有效地将输出音频信号的特征带至期望值。
[0015] 在较佳实施例中,多声道音频解码器被配置用于确定用来描述加权组合中解相关信号的贡献的权重,使得如果残差信号的能量为零,则解相关信号升混合参数所确定的最大权重关联至解相关信号,并且使得如果以残差信号加权系数进行加权的残差信号的能量大于或等于以解相关信号升混合参数进行加权的解相关信号的能量,则零权重关联至解相关信号。该实施例基于以下发现,应该被添加至降混合信号的期望能量根据以解相关信号升混合参数进行加权的解相关信号的能量所确定。进而,总结来说,如果以残差信号加权系数进行加权的残差信号的能量大于或等于以解相关信号升混合参数进行加权的解相关信号的能量,则不需要再加入解相关信号。换句话说,如果判断残差信号携带足够的能量(例如,足够到达必须的总能量),则解相关信号不再用于提供至少二个输出音频信号。
[0016] 在较佳实施例中,多声道音频解码器被配置用于计算以根据一个或多个解相关信号升混合参数进行加权的解相关信号的加权能量值,并且计算使用一个或多个残差信号升混合参数(其可等同于上述提及的残差信号加权系数)进行加权的残差信号的加权能量值,以根据解相关信号的加权能量值和残差信号的加权能量值来决定因子,并在因子的基础上获得用来描述解相关信号对于音频输出信号中(至少)一个的贡献的权重。在此可发现,该流程非常适合于用来描述解相关信号对于一个或多个输出音频信号的贡献的权重的高效率计算。
[0017] 在较佳实施例中,多声道音频解码器被配置用于将因子乘以解相关信号升混合参数,以获得用来描述解相关信号对于输出音频信号中的(至少)一个的贡献的权重。通过使用该流程,为了确定用来描述加权组合中解相关信号的贡献的权重,有可能考虑,用来描述至少二个输出音频信号(其根据解相关信号升混合参数进行描述)的期望信号特征的一个或多个参数,以及在解相关信号的能量以及残差信号的能量之间的关系。因此,当仍然考虑输出音频信号(由解相关信号升混合参数所反映)的期望特征时,在参数编码(或者主要地参数编码)和残差编码(或者主要地残差编码)之间的混合(或者衰退)是存在可能性的。
[0018] 在较佳实施例中,多声道音频解码器被配置用于在多个升混合声道和多个时隙上计算以使用解相关信号升混合参数进行加权的解相关信号的能量,以获得解相关信号的加权能量值。从而,有可能避免解相关信号的加权能量值的强烈变化。因此,多声道音频解码器的稳定调整可达成。
[0019] 类似地,多声道音频解码器被配置用于在多个升混合声道和多个时隙上计算以使用残差信号升混合参数进行加权的残差信号的能量,以获得残差信号的加权能量值。从而,由于避免了残差信号的加权能量值的强烈变化,多声道音频解码器的稳定调整可达成。然而,平均期间被选择地足够短,以允许加权的动态调整。
[0020] 在较佳实施例中,多声道音频解码器被配置用于根据解相关信号的加权能量值和残差信号的加权能量值之间的差异计算因子。一种计算,“比较”解相关信号的加权能量值和残差信号的加权能量值,允许使用(加权版本的)解相关信号补充残差信号(或者残差信号的加权版本),其中用来描述解相关信号的贡献的权重被调整到至少二个音频输出信号的提供的需求。
[0021] 在较佳实施例中,多声道音频解码器被配置用于根据比例计算因子,比例介于,解相关信号的加权能量值和残差信号的加权能量值之间的差异,和解相关信号的加权能量值之间。在此可发现,根据该比例的因子的计算带来长久特别的良好结果。此外,值得一提的是,为了达到良好的听觉印象(或是等价地,当相较于不存在残差信号的情况时,为了在输出音频信号中具有大体相同的信号能量),比例描述了解相关信号(使用解相关信号升混合参数进行加权)的全部能量的那部分在残差信号的出现是必须的。
[0022] 在较佳实施例中,多声道音频解码器被配置用于确定用来描述解相关信号对于两个或两个以上输出音频信号的贡献的权重。在此情况下,多声道音频解码器被配置用于在解相关信号的加权能量值和第一声道解相关信号升混合参数的基础上,确定解相关信号对于第一输出音频信号的贡献。此外,多声道音频解码器被配置用于在解相关信号的加权能量值和第二声道解相关信号升混合参数的基础上,确定解相关信号对于第二输出音频信号的贡献。于是,具有适度效果和良好音频质量的二个输出音频信号能够被提供,其中二个输出音频信号之间的差异通过第一声道解相关信号升混合参数和第二声道解相关信号升混合参数的运用而进行考虑的。
[0023] 在较佳实施例中,多声道音频解码器被配置用于如果残差能量超过解相关器能量(即,解相关信号的能量,或其加权版本的能量),则禁止解相关信号对于加权组合的贡献。于是,如果残差信号携带足够的能量,如果残差信号超过解相关器能量,有可能不需要解相关信号的运用便可以切换至单纯残差编码。
[0024] 在较佳实施例中,音频解码器被配置用于根据残差信号的加权能量值的频带化决定,频带化地确定用来描述加权组合中解相关信号的贡献的权重。于是,有可能不需要附加信号化负担即可弹性地决定,其中,至少二个输出音频信号的细化的频带应该(或是主要地)以参数编码为基础,其中,至少二个输出音频信号的细化的频带应该(或是主要地)以残差编码为基础。如此一来,可以灵活地决定频带,当持续保持解相关信号的权重相对小时,(至少主要地)使用残差编码执行波形再建(或是至少部分的波形再建)。如此一来,便有可能根据选择性地应用参数编码(其主要根据解相关信号的提供)和残差编码(其主要根据残差信号的提供)以获得良好音频质量。
[0025] 在较佳实施例中,音频解码器被配置用于针对输出音频信号的每个,确定用来描述加权组合中解相关信号的贡献的权重。于是,可获得精细时间分辨率,其允许弹性地在参数编码(或主要地参数编码)以及随后的帧之间的残差编码(或主要地残差编码)之间进行切换。于是,音频解码可被调整至具有良好时间分辨率的音频信号的特征。
[0026] 根据本发明的另一实施例建立用于在编码表示的基础上提供至少二个输出音频信号的多声道音频解码器。多声道音频解码器被配置用于在降混合信号的编码表示、多个编码空间参数和残差信号的编码表示的基础上,获得输出音频信号中的(至少)一个。多声道音频解码器被配置用于根据残差信号在参数编码和残差编码之间进行混合。于是,非常灵活的音频解码概念达成,其中最佳解码模式(参数编码和解码对(versus)残差编码和解码)能够在没有额外信号化负担下被选择。此外,上述解释的考虑也被应用。
[0027] 根据本发明的实施例建立用于提供多声道音频信号的编码表示的多声道音频编码器。多声道音频编码器被配置用于在多声道音频信号的基础上获得降混合信号。而且,多声道音频编码器被配置用于提供用来描述多声道音频信号的声道之间的相依性的参数,并提供残差信号。此外,多声道音频编码器被配置用于根据多声道音频信号改变被包含至编码表示中的残差信号的数量。通过改变被包含至编码表示中的残差信号的数量,灵活地调整编码流程至信号特征是有可能的。例如,为了某部分(例如,为了暂时部分和/或频率部分),有可能包含相对而言大数量的残差信号至编码表示中,其中理想的是保留,至少部分地,解码音频信号的波形。因此,多声道音频信号的更多精确的基于残差信号的再建通过改变被包含至编码表示中残差信号的数量的可能性而被启用。此外,值得一提的是,结合如上所述的多声道音频解码器,高效率概念被建立,因为上述多声道音频解码器甚至不需要附件信号化地在(主要地)参数编码和(主要地)残差编码之间进行混合。于是,在此讨论的多声道编码器允许利用可能通过使用上述的多声道音频编码器的优点。
[0028] 在较佳实施例中,多声道音频编码器被配置用于根据多声道音频信号改变残差信号的带宽。于是,便有可能对残差信号进行调整,使得残差信号有助于再建心理声学上最重要的频带或频率范围
[0029] 在较佳实施例中,多声道音频编码器被配置用于根据多声道音频信号选择残差信号被包含至编码表示中的频带。于是,对于必要或者最有益的频带,多声道音频编码器能决定其包含残差信号(其中残差信号典型地导致至少部分的波形再建)。例如,心理声学最重要的频带能够被考虑。此外,当残差信号代表性地帮助以改善音频解码器中瞬变的呈现,瞬间事件的存在也可以被考虑。此外,可用的比特率也能被考虑到计算中以决定被包含至编码表示中的残差信号的数量。
[0030] 在较佳实施例中,多声道音频编码器被配置用于针对多声道音频为音调的频带,选择性地将残差信号包含至编码表示中,并针对多声道音频为非音调的频带而省略残差信号至编码表示中的包含。该实施例基于这样的考虑,如果音调频带被以特定高质量以及优选地使用至少部分波形再建而重制时,则在音频解码器侧的可获得的音频质量即能够被改善。于是,针对多声道音频信号为音调的频带而言,当其导致在比特率和音频质量之间的良好妥协时,则选择性地包含残差信号至编码表示中将有许多益处。
[0031] 在较佳实施例中,多声道音频编码器被配置用于针对时间部分和/或针对频带,选择性地将残差信号包含至编码表示中,其中降混合信号的形成导致多声道音频信号的信号分量的取消。在此处可发现,如果存在多声道音频信号的分量的取消,以降混合信号为基础恰当地再建多音频信号将变得困难或者甚至是不可能的,因为甚至解相关或者预测都不能复原当在形成降混合信号时被取消的信号分量。在该情况下,残差信号的使用是一种高效率的方式以避免再建的多声道音频信号的重要退化。如此一来,当避免信号化效果时(例如,当考虑到与上述音频解码器的结合),该概念帮助改善了音频质量。
[0032] 在较佳实施例中,多声道音频编码器被配置用于检测降混合信号中多声道信号音频信号的信号分量的取消,且多声道音频解码器也被配置用于响应于检测的结果以激发残差信号的提供。于是,此处存在高效率的方式来避免不良的音频质量。
[0033] 在较佳实施例中,多声道音频编码器被配置用于使用多声道音频信号的至少二个声道信号的线性组合,并根据多声道解码器侧的待使用的升混合系数,计算残差信号。所以,残差信号以高效率的方式被计算且被良好地改编用于多声道音频解码器侧的多声道音频信号的再建。
[0034] 在实施例中,多声道音频编码器被配置用于使用用来描述多声道音频信号的声道之间的相依性的参数编码升混合系数,或从用来描述多声道音频信号的声道之间的相依性的参数获取升混合系数。于是,残差信号的提供能够有效地在参数(用于参数编码)的基础上被执行。
[0035] 在较佳实施例中,多声道音频编码器被配置用于使用心理声学模型时变地确定被包含至编码表示中的残差信号的数量。于是,针对具有相对地高心理声学关联的多声道音频信号的部分(暂时部分、频率部分或者时间-频率部分),相对地高数量的残差信号可以被包含,而在针对具有相对地低心理声学关联的多声道音频信号的暂时部分、频率部分或时间-频率部分时,(相对地)较少数量的残差信号则可以被包含。于是,在比特率和音频质量之间的良好平衡可以被达成。
[0036] 在较佳实施例中,多声道音频编码器被配置用于根据当前可用的比特率,时变地确定被包含至编码表示中的残差信号的数量。于是,音频质量能够被改编至可用的比特率,比特率允许针对当前可用的比特率而达到最佳可能的音频质量。
[0037] 根据本发明的实施例建立了用于在编码表示的基础上提供至少二个输出音频信号的方法。方法包括执行降混合信号、解相关信号和残差信号的加权组合,以获得输出音频信号中的一个。根据残差信号确定用来描述加权组合中解相关信号的贡献的权重。该方法以如上述音频解码器的相同考虑为基础。
[0038] 根据本发明的另一实施例建立了用于在编码表示的基础上提供至少二个输出音频信号的方法。方法包括在降混合信号的编码表示、多个编码空间参数和残差信号的编码表示的基础上获得输出音频信号中的(至少)一个。根据残差信号执行在参数编码和残差编码之间的混合(或衰退)。该方法也以如上所述的音频解码器的相同考虑为基础。
[0039] 根据本发明的另一实施例建立了用于提供多声道音频信号的编码表示的方法。方法包括在多声道音频信号的基础上获得降混合信号,并提供用来描述多声道音频信号的声道之间的相依性的参数,以及提供残差信号。被包含至编码表示中的残差信号的数量根据多声道音频信号而变化。该方法以如上所述的音频编码器的相同考虑为基础。
[0040] 根据本发明的进一步实施例建立了用于执行本文所描述的方法的计算机程序。附图说明
[0041] 根据本发明的实施例随后将参考附图进行描述,其中
[0042] 图1显示根据本发明实施例的多声道音频编码器的方框示意图。
[0043] 图2显示根据本发明实施例的多声道音频解码器的方框示意图。
[0044] 图3显示根据本发明另一实施例的多声道音频解码器的方框示意图。
[0045] 图4显示根据本发明实施例的用于提供多声道音频信号的编码表示的方法的流程图
[0046] 图5显示根据本发明实施例的用于在编码表示的基础提供至少二个输出音频信号的方法的流程图。
[0047] 图6显示根据本发明另一实施例的用于在编码表示的基础提供至少二个输出音频信号的方法的流程图。
[0048] 图7显示根据本发明实施例的解码器的流程示意图。
[0049] 图8显示混合残差解码器的示意图。

具体实施方式

[0050] 1.根据图1的多声道音频编码器
[0051] 图1显示用于提供多声道信号的编码表示的多声道音频编码器100的方框示意图。
[0052] 多声道音频编码器100被配置用于接收多声道音频信号110,并以多声道音频信号为基础提供多声道音频信号110的编码表示112。多声道音频编码器100包括处理器(或者处理装置)120,处理器120被配置用于接收多声道音频信号并在多声道音频信号110的基础上获得降混合信号122。处理器120还被配置用于提供用来描述多声道音频信号110的声道之间的相依性的参数124。而且,处理器120被配置用于提供残差信号126。此外,多声道音频编码器包括残差信号处理130,残差信号处理130被配置用于根据多声道音频信号110改变被包含至编码表示112中的残差信号的数量。
[0053] 然而,值得一提的是,多声道音频解码器并非必须包括独立处理器120和独立残差信号处理130。相反地,如果多声道音频编码器以某种方式被配置用于执行处理器120和残差信号处理130的功能就足够了。
[0054] 关于多声道音频编码器100的功能,值得一提的是,多声道音频信号110的声道信号一般使用多声道编码进行编码,其中编码表示112通常包括(在编码格式中)降混合信号122、用来描述多声道音频信号110的声道(或者声道信号)之间的相依性的参数124和残差信号126。降混合信号122,例如,可以是基于多声道音频信号的声道信号的组合(例如线性组合)。然而,降混合信号122可以在多声道音频信号的声道信号的基础上被提供。然而,可选地,两个或两个以上的降混合信号可以关联至多声道音频信号110的较大数量(通常大于降混合信号的数量)的声道信号。参数124可以描述多声道音频信号110的声道(或者声道信号)之间的相依性(例如,相关性、协方差、位准关系等)。于是,参数124用作在音频解码器侧,在降混合信号122的基础上获取多声道音频信号110的声道信号的再建版本。对于该目的,参数124描述多声道音频信号的声道信号的期望特征(例如,个体特征或相关特征),使得使用参数解码的音频编码器能够在一个或多个降混合信号122的基础上再建声道信号。
[0055] 此外,多声道音频解码器100根据多声道音频编码器的期望或评估而提供残差信号126,该残差信号126一般表示信号分量,且该信号分量无法由音频解码器(例如,遵守特定处理规则的音频解码器)在降混合信号122和参数124的基础上再建。于是,残差信号126一般能够被考虑作为音频解码器侧的优化信号,该精致信号允许从再建而来的波形或至少局部波形。
[0056] 然而,多声道音频编码器100被配置用于根据多声道音频信号110改变被包含至编码表示112中的残差信号的数量。换句话说,多声道音频编码器例如可以决定关于被包含至编码表示112中的残差信号126的强度(或者能量)。附加地或可选地,多声道音频编码器100可以决定对于频带和/或有多少的频带及残差信号被包含至编码表示112中。通过根据多声道音频信号(和/或根据可用比特率)改变被包含至编码表示中的残差信号126的“数量”,多声道音频编码器100能灵活地决定那些精确度,而多声道音频信号110的声道信号能够以编码表示112为基础而在音频解码器侧进行再建。因此,精确度与那些多声道音频信号110的声道信号能够被再建、被改编至多声道音频信号110的声道信号的不同信号部分(例如,暂时部分、频率部分和/或时间/频率部分)的心理声学相关性。因此,通过包括“大数量”的残差信号126至编码表示中,高心理声学相关性的信号部分(例如,音调信号部分或包含瞬变事件的信号部分)能够以特别高的分辨率进行编码。例如,针对高心理声学相关性的信号部分,可以通过包括具有相对高能量的残差信号至编码表示112中而实现。此外,如果降混合信号122包括“不佳质量”,例如,如果当结合多声道音频信号112的声道信号至降混合信号122中时,存在信号分量的大量取消,则可以实现为,具有高能量的残差信号被包含至编码表示112中。换句话说,多声道音频解码器100能针对多声道音频信号110的信号部分,选择性地嵌入“大数量”的残差信号(例如,具有相对高能量的残差信号)至编码表示112中,而残差信号的相对较大数量的提供带来再建声道信号(音频解码器侧的再建)的重要的改善。
[0057] 于是,根据多声道音频信号110的被包含至编码表示中的残差信号的数量的改变允许改编多声道音频信号110的编码表示112(例如,以编码形式被包含至编码表示中的残差信号126),使得再建的多声道音频信号(音频解码器侧再建的)的比特率效率和音频质量之间能达到良好的平衡。
[0058] 值得一提的是,多声道音频编码器100能够选择性地以多种方式来进行改善。例如,多声道音频编码器可以被配置用于根据多声道音频信号110改变残差信号126(被包含至编码表示中)的带宽。于是,被包含至编码表示112中的残差信号的数量能够被改编至感知上最重要的频带。
[0059] 可选择地,多声道音频解码器被配置用于根据多声道音频信号110选择残差信号126被包含至编码表示112中的频带。于是,编码表示120(精确地来说,被包含至编码表示
112中的残差信号的数量)可以被改编至多声道音频信号,例如,至多声道音频信号110的感知上最重要的频带。
[0060] 可选择地,多声道音频编码器可以被配置用于针对多声道音频为音调的频带,包含残差信号126至编码表示中。另外,多声道音频编码器可以被配置用于针对非音调的多声道音频信号的频带(除非有其他特定条件满足在特定频带中引起残差信号被包含至编码表示中),不包含残差信号126至编码表示112中。如此一来,针对感知上重要的音调频带,残差信号可以选择性地被包含至编码表示中。
[0061] 可选择地,多声道音频编码器被配置用于针对时间部分和/或频率频带,选择地包含残差信号至编码表示中,其中降混合信号的形成导致多声道音频信号的信号分量的取消。例如,多声道音频编码器可以被配置用于检测降混合信号122中多声道音频信号110的信号分量的取消,并且响应于检测的结果而激发残差信号126的提供(例如,残差信号126至编码表示112中的包含)。于是,如果多声道音频信号110的声道信号降至降混合信号122的混合(或任何其他一般的线性组合)导致多声道音频信号112的信号分量的取消(例如,其可能由相位偏移180度的不同声道信号的信号分量所引起),则在音频解码器中再建多声道音频信号110时,帮助克服该取消的有害影响的残差信号126将会被包含至编码表示112中。例如,针对存在这样的取消的频带,残差信号126可以选择性地被包含至编码表示112中。
[0062] 可选择地,多声道音频编码器被配置用于使用多声道音频信号的至少二个声道信号的线性组合,并根据多声道解码器侧的待使用的升混合系数,计算残差信号。这样的残差信号的计算是高效率的,且允许音频解码器侧的声道信号的简单再建。
[0063] 可选择地,多声道音频编码器被配置用于使用用来描述多声道音频信号的声道之间的相依性的参数124来编码升混合系数,或从用来描述多声道音频信号的声道之间的相依性的参数获取升混合系数。于是,参数124(例如,信道间位准差参数、信道间相关参数或者其他)可以被使用于参数编码(编码或解码)和残差信号辅助编码(编码或解码)。如此一来,残差信号126的运用便不会伴随附加信号化负担。相反地,不管怎样用于参数编码(编码/解码)的参数124,也被再次使用于残差编码(编码/解码),如此即可达到高的编码效率。
[0064] 可选择地,多声道音频解码器被配置用于使用心理声学模型,时变地确定被包含至编码表示中的残差信号的数量。于是,编码精准度能够被改编至信号的心理声学特征,而导致良好高效率的比特率。
[0065] 然而,值得一提的是,多声道音频编码器能选择性地通过任何本文描述的特征或功能(说明书权利要求书中)来补充。此外,多声道音频编码器还可以根据此处所描述的音频解码器平行地被改编,以与音频解码器进行合作。
[0066] 2.根据图2的多声道音频解码器
[0067] 图2显示根据本发明实施例的多声道音频解码器200的方框示意图。
[0068] 多声道音频解码器200被配置用于接收编码表示210,并在该编码表示210的基础上提供至少二个输出音频信号212,214。多声道音频解码器200,例如,包括加权组合器220,该加权组合器220被配置用于执行降混合信号222、解相关信号224和残差信号226的加权组合,以获得输出信号中的(至少)一个,例如,第一输出音频信号212。值得一提的是,例如,降混合信号212、解相关信号224和残差信号226可以从编码表示210获得,其中编码表示210可以携带降混合信号220的编码表示和残差信号226的编码表示。而且,例如,解相关信号224可以从降混合信号222获得,或者使用被包含至编码表示210中的附加信息所获得。然而,解相关信号也可以从编码表示210提供且不具任何专属的信息。
[0069] 多声道音频解码器200也可以被配置用于根据残差信号226确定用来描述加权组合中解相关信号224的贡献的权重。例如,多声道音频解码器200可以包括权重决定器230,权重决定器230被配置用于在残差信号226的基础上确定用来描述加权组合中解相关信号224的贡献(例如,解相关信号224对于第一输出音频信号212的贡献)的权重232。
[0070] 关于多声道音频解码器200的功能,值得一提的是,解相关信号224对于加权组合,以及对于第一输出音频信号212的贡献,是根据残差信号226以灵活的(例如,暂时性变量和频率相关)方式来进行调整的,而没有额外信号化负担。于是,被包含至第一输出音频信号212的解相关信号224的数量根据被包含至第一输出音频信号212的残差信号226的数量而改编,使得第一输出音频信号212达到良好的质量。于是,在任何情况下便可能获得解相关信号224的适当加权且不具额外信号化负担。如此一来,使用多声道音频解码器200,使用中等的比特率即可达到解码输出音频信号212的良好质量。再建的精准度能够被音频编码器灵活地调整,其中音频编码器能决定被包含至编码表示212中的残差信号226的数量(例如,多大的残差信号226能量被包含至编码表示210中,或者多少相关的频带残差信号226被包含在编码表示210中),并且多声道音频解码器200能因此反应并调整解相关信号224的权重,以适合被包含至编码表示210中的残差信号226的数量。因此,如果存在大数量的被包含至编码表示210中的残差信号226(例如,针对特定的频带或者特定的暂时部分),加权组合
220可以主要地(或完全地)考虑残差信号226而给予低权重(或不给予权重)至解相关信号
224。相反地,如果仅仅存在小数量的被包含至编码表示210中的残差信号226,加权组合220可以主要地(或完全地)考虑解相关信号224,且除了降混合信号222外,其仅相对性低程度地(或完全不)考虑残差信号226。如此一来,多声道音频解码器200能够与适当的多声道音频编码器灵活的合作,并且调整加权组合220在任何情况下(不考虑被包含至编码表示210中的残差信号226为小数量或大数量)能达到最好的可能音频质量。
[0071] 值得一提的是,第二输出音频信号214可以以相似的方式而被产生。然而,相同的机制可以非必要的应用到第二输出音频信号214中,例如,如果存在相对于第二输出音频信号的不同质量要求。
[0072] 在可选择的改进方案中,多声道音频解码器可以被配置用于根据解相关信号224确定用来描述加权组合中解相关信号224的贡献的权重232。换句话说,权重232可以取决于残差信号226和解相关信号224。于是,权重232甚至可以更好地改编至没有附件信号化负担的当前解码音频信号。
[0073] 在另一可选择的改进方案中,多声道音频解码器可以被配置用于在编码表示212的基础上获得升混合参数,并根据升混合参数确定用来描述加权组合中解相关信号的贡献的权重232。于是,权重232可以额外地取决于升混合参数,使得权重232的更佳的改编可以达成。
[0074] 作为另一可选择的改进方案,多声道音频解码器可以被配置用于确定用来描述加权组合中解相关信号的贡献的权重,使得解相关信号的权重随着残差信号的能量的增加而减少。于是,在主要基于解相关信号224(除了降混合信号222)的解码和主要基于残差信号226(除了降混合信号222)的解码之间可以执行混合或者衰退。
[0075] 作为另一可选择的改进方案,多声道音频解码器200可以被配置用于确定权重232,使得如果残差信号226的能量为零,则解相关信号升混合参数(其可以被包含至编码表示210中或从编码表示210获取)所确定的最大权重关联至解相关信号224,并且使得如果以残差信号加权系数进行加权的残差信号225的能量大于或等于以解相关信号升混合参数进行加权的解相关信号224的能量,则零权重关联至解相关信号224。于是,有可能在以解相关信号224为基础的解码和以残差信号226为基础的解码之间进行完全地混合(或者衰退)。如果残差信号226被评断为足够强大(例如,当加权残差信号的能量等于或大于加权解相关信号224的能量),加权组合可以完全地依靠残差信号226以精致化降混合信号222而不考虑剩下的解相关信号224。在该实施例中,因为解相关信号224的考虑通常预防了特定良好的波形再建,而残差信号226的运用通常允许良好的波形再建,所以多声道音频解码器200侧的特定良好的(至少部分)波形再建可以被执行。
[0076] 在另一可选择的改进方案中,多声道音频解码器200可以被配置用于计算以根据一个或多个解相关信号升混合参数进行加权的解相关信号的加权能量值,并计算以使用一个或多个残差信号升混合参数进行加权的残差信号的加权能量值。在该实施例中,多声道音频解码器被配置用于根据解相关信号的加权能量值和残差信号的加权能量值来确定因子,并在因子的基础上获得用来描述解相关信号224对于输出音频信号中一个(例如,第一输出音频信号212)的贡献的权重。如此一来,权重决定器230可以提供特定良好改编的加权值232。
[0077] 在可选择的改进方案中,多声道音频解码器200(或者其权重决定器230)可以被配置用于将因子乘以解相关信号升混合参数(被包含在编码表示210中或者从编码表示210所获得的),以获得用来描述解相关信号224对于输出音频信号中一个(例如第一输出音频信号212)的贡献的权重232(或者加权值)。
[0078] 在可选择的改进方案中,多声道音频解码器(或者其权重决定器230)可以被配置用于在多个升混合声道和多个时隙上计算以使用解相关信号升混合参数(被包含在编码表示210中或从编码表示210所获得的)进行加权的解相关信号的能量,以获得解相关信号的加权能量值。
[0079] 作为更进一步可选择的改进方案,多声道音频解码器200可以被配置用于在多个升混合声道和多个时隙上计算以使用残差信号升混合参数(被包含在编码表示210中或从编码表示210所获得的)进行加权的残差信号的能量,以获得残差信号的加权能量值。
[0080] 作为另一可选择的改进方案,多声道音频解码器200(或其权重决定器232)可以被配置用于根据解相关信号的加权能量值和残差信号的加权能量值之间的差异计算上述因子。由此可发现,这样的计算是确定加权数值232的高效率解决方式。
[0081] 作为可选择的改进方案,多声道音频解码器可以被配置用于根据差异和解相关信号224的加权能量值之间的比例计算因子,差异是解相关信号224的加权能量值和残差信号226的加权能量值之间的差异。由此可发现,对于,这样的计算对于因子而言带来良好的结果,以用于混合根据细化降混合信号222的的主要解相关信号和根据细化降混合信号222的的主要残差信号。
[0082] 作为可选择的改进方案,多声道音频解码器200可以被配置用于确定用来描述解相关信号对于两个或两个以上输出音频信号的贡献的权重,例如,第一输出音频信号212和第二输出音频信号214。在该情况下,多声道音频解码器可以被配置用于在解相关信号224的加权能量值和第一声道解相关信号升混合参数的基础上,确定解相关信号224对于第一输出音频信号212的贡献。此外,多声道音频解码器可以被配置用于在解相关信号224的加权能量值和第二声道解相关信号升混合参数的基础上,确定解相关信号224对于第二输出音频信号214的贡献。换句话说,不同的解相关信号升混合参数可被用于提供第一输出音频信号212和第二输出音频信号214。然而,解相关信号的相同加权能量值可被用于确定解相关信号对于第一输出音频信号212的贡献,和解相关信号对于第二输出音频信号214的贡献。如此一来,高效率的调整便成为可能的,其中二个输出音频信号212,214的不同特征可以通过不同的解相关信号升混合参数而被考虑。
[0083] 作为可选择的改进方案,多声道音频解码器200可以被配置用于如果残差能量(例如,残差信号226的能量或者残差信号226的加权版本的能量)超过解相关能量(例如,解相关信号224的能量或解相关信号224的加权版本的能量),则禁止解相关信号对于加权组合的贡献。
[0084] 作为更进一步可选择的改进方案,音频解码器可以被配置用于根据残差信号的加权能量值的频带化决定,频带化地确定用来描述加权组合中解相关信号224的贡献的权重232。于是,可以执行多声道音频解码器200到待解码信号的微调。
[0085] 在另一可选择的改进方案中,音频解码器可以被配置用于针对输出音频信号212,214的每个框,确定用来描述加权组合中解相关信号的贡献的权重。于是,可达成良好的暂时分辨率。
[0086] 在更进一步可选择的改进方案里,加权值232的决定可以根据下文提供的部分公式而被执行。
[0087] 然而,值得一提的是,多声道音频解码器200可通过任何本文所述的特征或功能来补充,并且相对于其他的实施例。
[0088] 3.根据图3的多声道音频解码器
[0089] 图3显示根据本发明实施例的多声道音频解码器300的方框示意图。多声道音频解码器300被配置用于接收编码表示310,并在编码表示的基础上提供二个或二个以上输出音频信号312,314。例如,编码表示310可以包含降混合信号的编码表示、一个或多个空间参数的编码表示和残差信号的编码表示。多声道音频解码器300被配置用于在降混合信号的编码表示、多个编码空间参数和残差信号的编码表示的基础上,获得输出音频信号中的(至少)一个,例如,第一输出音频信号312和/或第二输出音频信号314。
[0090] 特别是,多声道音频解码器300被配置用于根据残差信号(以编码形式被包含至编码表示310中)在参数编码和残差编码之间进行混合。换句话说,在一个解码模式中,在降混合信号的基础上并使用用来描述输出音频信号312,314之间的期望关系的参数(例如,输出音频信号312,314的期望声道间位准差或期望声道间相关性),输出音频信号312,314的提供被执行,在另一解码模式中,在使用残差信号的降混合信号的基础上,输出音频信号312,314进行再建,多声道音频解码器300可以在此两种解码模式之间进行混合。如此一来,被包含至编码表示310中的残差信号的强度(例如,能量)可以确定解码是否主要(或完全地)以空间参数(除了降混合信号)为基础,或解码是否主要(或完全地)以残差信号(除了降混合信号)为基础,或是否采用中间状态以从降混合信号获取输出音频信号312,314,其中空间参数和残差信号都影响降混合信号的细化。
[0091] 此外,多声道音频解码器300,通过在参数编码(通常,当提供输出音频信号312,314时,相对高的权重被给予至解相关信号)和残差编码(通常,相对低的权重被给予至解相关信号)之间的混合,而允许被良好改编至目前音频内容的解码,其中该解码不存在高信号化的负担。
[0092] 然而,值得一提的是,多声道音频解码器300基于如多声道音频解码器200的相似考虑,且上述关于多声道音频解码器200的可选择的改进方式也可以应用于多声道音频解码器300。
[0093] 4.根据图4的用于提供多声道音频信号的编码表示的方法
[0094] 图4显示用于提供多声道音频信号的编码表示的方法400的流程图。
[0095] 方法400包含步骤410,在多声道音频信号的基础获得降混合信号。方法400还包括步骤420,提供用来描述多声道音频信号的声道之间的相依性的参数。例如,声道间位准差参数和/或声道间相关性参数(或者协方差参数)可以被提供,用于描述多声道音频信号的声道之间的相依性。方法400还包含步骤430,提供残差信号。此外,方法包含步骤440,根据多声道音频信号改变被包含至编码表示中的残差信号的数量。
[0096] 值得一提的是,方法400基于根据图1的音频编码器100的相同考虑。此外,方法400可通过任何本文及有关于发明装置所描述的特征或功能来补充。
[0097] 5.根据图5的用于在编码表示的基础上提供至少二个输出音频信号的方法
[0098] 图5显示用于在编码表示的基础提供至少二个输出音频信号的方法的流程图。方法500包括根据残差信号确定510用来描述加权组合中解相关信号的贡献的权重。方法500还包括执行520降混合信号、解相关信号和残差信号的加权组合,以获得输出音频信号中的一个。
[0099] 值得一提的是,此方法500可通过任何本文及有关于此发明装置所描述的特征或功能来补充。
[0100] 6.根据图6的用于在编码表示的基础上提供至少二个输出音频信号的方法
[0101] 图6显示用于在编码表示的基础提供至少二个输出音频信号的方法的流程图。方法600包括在降混合信号的编码表示、多个编码空间参数和残差信号的编码表示的基础上获得610输出音频信号中的一个。获得610输出音频信号中的一个包括根据残差信号执行620参数编码和残差编码之间的混合。
[0102] 值得一提的是,此方法600可通过任何本文及有关于此发明装置所描述的特征或功能来补充。
[0103] 7.进一步的实施例
[0104] 在下文中,部分一般考虑和部分进一步的实施例将被描述。
[0105] 7.1一般考虑
[0106] 根据本发明的实施例以以下理念为基础,取代使用固定的残差带宽,解码器(例如,多声道音频解码器)通过针对每个框(或者,一般地,至少针对多个频率范围和/或多个暂时部分)测量其能量频带而检测传输的残差信号的数量。根据传输的空间参数,解相关输出被增加到残差能量的“遗失”处,以达到输出能量和解相关的需要(或期望)数量。其允许变动的残差带宽和频带通过式残差信号。例如,有可能只有针对音调频带使用残差编码。为了能够针对参数编码和波形保留编码(其也被指定作为残差编码)而使用简易降混合,用于简易降混合的残差信号在此被定义。
[0107] 7.2用于简易降混合的残差信号的计算
[0108] 在下文中,部分关于残差信号的计算的考虑和关于多声道音频信号的声道信号的结构的考虑将被描述。
[0109] 在统一语音和音频编码(USAC)中,当所谓的“简易降混合”被使用时,并不存在所定义的残差信号。因此,没有部分波形保留编码是可能的。然而,在下文中,为了所谓“简易降混合”而用于计算残差信号的方法将被描述。
[0110] 针对每个缩放因子频带,“简易降混合”权重d1,d2被计算,而,针对每个参数频带,参数升混合系数ud1,ud2被计算。如此一来,用于计算残差信号的系数wr1,wr2便无法从空间参数(因为此情况为古典的MPEG环绕)直接地进行计算,但是可以需要从降混合和升混合系数被用来确定频带化的缩放因子。
[0111] 利用L,R作为输入声道,D作为降混合声道,残差信号res应该遵守下列特点:
[0112] D=d1L+d2R  (1)
[0113] L=ud,1D+ur,1res  (2)
[0114] R=ud,2D+ur,2res  (3)
[0115] 通过下式以计算该残差
[0116] res=wr,1L+wr,2R  (4)
[0117] 使用降混合权重
[0118]
[0119]
[0120] 被解码器使用的残差升混合系数ur,1,ur,2被选择,以保证强健的解码。因为简易降混合具有非对称的特性(相对于具有固定权重的MPEG环绕),根据空间参数的升混合被应用,如使用以下的升混合系数:
[0121] ur,1=max{ud,1,0.5}  (7)
[0122] ur,2=-max{ud,2,0.5}  (8)
[0123] 另一个选择是定义正交于降混合信号的升混合系数的残差升混合系数,使得:
[0124]
[0125] 换句话说,音频解码器可以使用左声道信号L(第一声道信号)和右声道信号R(第二声道信号)的线性组合获得降混合信号D。类似地,使用左声道L和右声道信号R(或者,一般地,多声道音频信号的第一声道信号和第二声道信号)的线性组合获得残差信号res。
[0126] 例如,从此可看出,在公式(5)及(6)中,当简易降混合权重d1,d2,参数升混合系数ud,1及ud,2和残差升混合系数ur,1及ur,2被决定时,用于获得残差信号res的降混合权重wr,1及wr,2能够被获得。此外,可以发现的是,使用公式(7)及(8)或公式(9)从ud,1及ud,2即能获取ur,1及ur,2。简易降混合权重d1及d2以及参数升混合系数ud,1及ud,2可以通过普通方式获得。
[0127] 7.3编码处理
[0128] 在下文中,关于编码处理的部分细节将会被描述。例如,编码可以通过多声道音频编码器100或者其他任何适当的装置或计算机程序所执行。
[0129] 优选地,根据音频信号(例如,根据多声道音频信号110的声道信号)和可用比特率,被传输的残差的数量通过编码器(例如,多声道音频编码器)的心理声学模型确定。例如,传输的残差信号能被使用于部分波形保存或者为了避免使用降混合方法(例如,由上述公式(1)所描述的降混合方法)所引起的信号取消。
[0130] 7.3.1部分波形保存
[0131] 在下文中,部分波形保存如何达成将被描述。例如,计算的残差(例如,根据公式(4)的残差res)全频带地或有限频带地被传输,以在残差带宽中提供部分波形保存。例如,被心理声学模型检测为感知不相关的残差部分可以被量化成零(例如,当在残差信号126的基础上提供编码表示112)。即包括但可不限于,在运行时间减少传输的残差带宽(这可以被认为是改变被包含至编码表示中的残差信号的数量)。该系统也可以允许残差信号部分的频带通过式删除,因为遗失的信号能量将通过解码器(例如,通过多声道音频解码器200或者多声道音频解码器300)而再建。如此一来,例如,残差编码可以唯一应用到信号的音调分量,保留其相位关系,而背景噪声能够被参数化地编码以减少残差比特率。换句话说,针对多声道音频信号110(或者多声道音频信号110的声道信号中的至少一个)被发现为音调的频带和/或暂时部分,残差信号126可以仅仅被包含至编码表示112中(例如,通过残差信号处理130)。相反,针对多声道音频信号110(或者是多声道音频信号110的声道信号中的至少一个)被识别为类似噪声的频带和/或暂时部分,残差信号126可以不被包含至编码表示112中。如此一来,根据多声道音频信号,被包含至编码表示中的残差信号的数量被改变。
[0132] 7.3.2降混合中信号取消的避免
[0133] 在下文中,降混合中信号取消如何被避免(或者被补偿)将被描述。
[0134] 对于低比特率的应用,参数编码(主要地或完全地依赖参数124,参数124用来描述多声道音频信号的声道之间的相依性)取代波形保留编码(例如,除了降混合信号122外,主要依赖残差信号126)而被应用。此处,残差信号126仅仅用于对于降混合122中的信号取消进行补偿,以最小化残差的比特使用。只要在降混合122中没有信号取消被检测到,系统使用解相关器(在音频解码器侧)运行在参数模式下。例如,针对相位音调信号,当信号取消发生时,残差信号126为了受损的信号部分(例如,频带和/或暂时部分)而进行传输。如此一来,信号能量即可通过解码器复原。
[0135] 7.4解码处理
[0136] 7.4.1概观
[0137] 在解码器中(例如,在多声道音频解码器200或者多声道音频解码器300中),传输的降混合信号和残差信号(例如,降混合信号222或者残差信号226)通过核心解码器进行解码,且和解码的MPEG环绕负载一起被馈入至MPEG环绕解码器。用于传统的MPS降混合的残差升混合系数是不改变的,且用于简易降混合的残差升混合系数在公式(7)及(8)和/或(9)中被定义。另外,解相关器的输出和其加权系数被计算以用于参数解码。残差信号和解相关器的输出被加权且被混合至输出信号。因此,加权因子通过测量残差和解相关信号的能量而被决定。
[0138] 换句话说,残差升混合因子(或者系数)可以通过测量残差和解相关信号的能量而确定。
[0139] 例如,降混合信号222在编码表示210的基础上被提供,而解相关信号224从降混合信号222获取,或者(或,否则)在被包含至编码表示210中的参数的基础上所产生。例如,残差升混合系数可以通过解码器根据公式(7)及(8)从参数升混合系数ud,1及ud,2获取,其中例如,在编码表示210的基础上,参数升混合系数ud,1,ud,2可以从被包含至编码表示210中的空间数据(如从声道间的相关性系数和声道间位准差系数,或者从对象间的相关性系数和对象间位准差)而直接地被获得。
[0140] 用于解相关器输出(一个或多个)的升混合系数可以被获得以作为常规的MPEG环绕解码。然而,用于加权解相关器输出(一个或多个)的加权因子可在残差信号的能量的基础上(也可能在解相关器信号(一个或多个)的能量的基础上)而被确定,使得根据残差信号,用来描述加权组合中解相关信号的贡献的权重被确定。
[0141] 7.4.2实例应用
[0142] 在下文中,参考图7,实例应用将会被描述。然而,值得一提的是,在此处描述的概念也能应用到根据图2和图3的多声道音频解码器200或300中。
[0143] 图7显示解码器(例如,多声道音频解码器)的方示意图(或流程图)。根据图7,使用700来表示解码器的全部。解码器700被配置用于接收位串流710,并在其基础上提供第一输出声道信号712和第二输出声道信号714。解码器700包括核心解码器720,核心解码器720被配置用于接收位串流710并在其基础上提供降混合信号722、残差信号724和空间数据726。例如,作为降混合信号,核心解码器720可以提供位串流710表示的降混合信号的时间域表示或转换域表示(例如,频率域表示、MDCT域表示、QMF域表示)。类似地,核心解码器720可以提供位串流710表示的残差信号724的时间域表示或者转换域表示。此外,核心解码器
720可以提供一个或多个空间参数726,例如,一个或多个声道间相关性参数、声道间位准差参数或者其他参数。
[0144] 解码器700还包括解相关器730,解相关器730被配置用于在降混合信号722的基础上提供解相关信号732。任何其他已知的解相关概念也可以被解相关器730所使用。此外,解码器700还包括升混合系数计算器740,升混合系数计算器740被配置用于接收空间数据726并提供升混合参数(例如,升混合参数udmx,1,udmx,2,udec,1和udec,2)。此外,解码器700包括升混合器750,升混合器750被配置用于在空间数据726的基础上应用由升混合系数计算器740所提供的升混合参数742(也被指派作为升混合系数)。例如,升混合器750可以使用两个降混合信号升混合系数(例如,udmx,1,udmx,2)来缩放降混合信号722,以获得降混合信号722的两个升混合版本752,754。此外,升混合器750还被配置应用一个或多个升混合参数(例如,两个升混合参数)至由解相关器730所提供的解相关信号732,以获得解相关信号732的第一升混合(缩放的)版本756和第二升混合(缩放的)版本758。此外,升混合器750被配置应用一个或多个升混合系数(例如,二个升混合系数)至残差信号724,以获得残差信号724的第一升混合(缩放的)版本760和第二升混合(缩放的)版本762。
[0145] 解码器700还包括权重计算器770,该权重计算器770被配置用于测量解相关信号752的升混合(缩放的)版本756,758的能量以及残差信号724的升混合(缩放的)版本760,
762的能量。此外,权重计算器770被配置用于提供一个或多个加权值772至权重器780。权重器780被配置用于使用权重计算器770提供的一个或多个加权值772,而获得解相关信号732的第一升混合(缩放的)和加权版本782、解相关信号732的第二升混合(缩放的)和加权版本
784、残差信号724的第一升混合(缩放的)和加权版本786以及残差信号724的第二升混合(缩放的)和加权版本788。解码器还包括第一增加器790,第一增加器790被配置用于合计降混合信号720的第一升混合(缩放的)版本752、解相关信号732的第一升混合(缩放的)和加权版本782以及残差信号724的第一升混合(缩放的)和加权版本786,以获得第一输出声道信号712。此外,解码器包括第二增加器792,第二增加器792被配置用于合计降混合信号720的第二升混合版本754、解相关信号732第二升混合(缩放的)和加权版本784以及残差信号
724的第二升混合(缩放的)和加权版本788,以获得第二输出声道信号714。
[0146] 然而,值得一提的是,权重器780并不需要加权所有的信号756,758,760,762。例如,在部分实施例中,仅加权信号756,758就足够了,而不影响到剩下的信号760及762(使得,信号760,762可以直接地被应用到增加器790,792)。然而,可选地,残差信号760,762的加权可以随时间而变动。例如,残差信号可以被衰退或被淡出。例如,残差信号的权重(或权重因子)可以随时间而进行平滑,且残差信号可相对地被衰退或被淡出。
[0147] 此外,值得一提的是,被权重器780执行的加权和被升混合器750应用的升混合也可以被执行为结合操作,其中权重计算可以直接地使用解相关信号732和残差信号724来执行。
[0148] 在下文中,关于解码器700的功能的部分进一步细节将会被描述。
[0149] 例如,结合的残差和参数编码模式可以通过半向后兼容方式被信号化,例如,通过在位串流中信号化一个参数频带的残差带宽。如此一来,通过切换至高于第一参数频带的参数解码,传统解码器将仍然可以通过并解码位串流。使用残差带宽的传统位串流无法包括高于第一参数频带的残差能量,这将导致在新提出的解码器中的参数解码。
[0150] 然而,在三维音频编解码系统中,结合的残差和参数编码和其他核心解码器工具(例如四声道分量)结合使用,使解码器明确地检测传统位串流并在规律有限频带的残差编码模式下解码传统位串流。当实际的残差带宽在运行时间被解码器决定时,其优选地可以非准确地被信号化。升混合系数的计算被设定至参数模式,而非残差编码模式。针对每个帧,加权解相关器的输出Edec和加权残差信号Eres的能量随着所有时隙ts和混合声道ch在每个混合频带hb被计算:
[0151]
[0152]
[0153] 这里,udec指派用于频带hb、用于时隙ts和用于升混合声道ch的解相关信号升混合参数, 指派升混合声道ch上的总和, 指派时隙ts上的总和。xdec指派用于频带hb、用于时隙ts和用于升混合声道ch的解相关信号的值(例如,复杂转换域值)。
[0154] 残差信号(例如,升混合残差信号760或者升混合残差信号762)以权重为1的值而增加到输出声道(例如,到输出声道712,714)中。解相关器信号(例如,升混合解相关信号756或者升混合解相关信号758)可以以因子r(例如,通过权重器780)进行加权,其计算方式如下:
[0155]
[0156] 其中Edec(hb)表示用于频带hb的解相关信号xdec的加权能量值,且其中Eres(hb)表示用于频带hb的残差信号xres的加权能量值。
[0157] 如果没有残差(例如,没有残差信号724)被传输,例如,如果Eres=0,r(被加权器780所应用的因子,其可以考虑被视为加权值772)变成1,其等价于单纯的参数解码。如果残差能量(例如,升混合残差信号760和升混合残差信号762的能量)超过解相关器的能量(例如,升混合解相关信号756或升混合解相关信号758的能量),例如,如果Eres>Edec,因子r可以被设定为零,以关闭解相关器且启用部分波形保留解码(其被认为是残差编码)。在升混合处理中,加权解相关器输出(例如,信号782和784)和残差信号(例如,信号786,788或信号
760,762)都被加入至输出声道(例如,信号712,714)。
[0158] 总结来说,其将导致矩阵形式的升混合规则,
[0159]
[0160] 其中ch1表示第一输出音频信号的一个或多个时间域样本或者转换域样本,其中ch2表示第二输出音频信号的一个或多个时间域样本或者转换域样本,其中xdmx表示降混合信号的一个或多个时间域样本或者转换域样本,其中xdec表示解相关信号的一个或多个时间域样本或者转换域样本,其中xres表示残差信号的一个或多个时间域样本或者转换域样本,其中udmx,1表示用于第一输出音频信号的降混合信号升混合参数,其中udmx,2表示用于第二输出音频信号的降混合信号升混合参数,其中udec,1表示用于第一输出音频信号的解相关信号升混合参数,其中udec,2表示用于第二输出音频信号的解相关信号升混合参数,其中max表示极大算符,以及其中r表示根据残差信号的用来描述解相关信号的权重的因子。
[0161] 升混合系数Udmx,1,Udmx,2,Udec,1,Udec,2被计算用于MPS 2-1-2参数模式。进一步的细节可参考上述的MPEG环绕概念的标准。
[0162] 综述,根据本发明的实施例建立概念,以在降混合信号、残差信号和空间数据的基础上,提供输出声道信号,其中解相关信号的加权可以灵活地被调整而没有任何显著的信号化负担。
[0163] 7.5实施方案
[0164] 虽然部分方面已经在装置的上下文中被描述,可清楚地得知,这些方面也表示相关方法的描述,其中区块或装置对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对应区块或对应装置的项目或特征的描述。部分或全部方法步骤可以通过(或使用)硬件装置来被执行,例如,微处理器、可编程计算机或电子电路。在部分实施例中,一些或更多的最重要方法步骤可以通过这样的装置来被执行。
[0165] 本发明的编码音频信号能够储存在数字储存媒介中,或能够通过传输媒介传输,这样的传输媒介可以是无线传输媒介或有线传输媒介,如因特网。
[0166] 根据特定实施例的需求,本发明的实施例可以在硬件或软件上实施。该实施方式可使用数字储存媒介来执行,例如,软盘(floppy disk),DVD,Blu-Ray,CD,ROM,PROM,EPROM,EEPROM或闪存,具有储存其上的电子可读控制信号,并可以与可编程计算机系统合作(或具有合作的能),使得各个方法可以被执行。因此,数字储存媒介是计算机可读的。
[0167] 根据本发明的部分实施例包括数据载体,其具有电子可读控制信号,并能够与可编程计算机系统合作,使得在这里描述的其中一个方法可以被执行。
[0168] 一般来说,本发明的实施例可以被实施为具有程序代码的计算器程序产品,当计算器程序产品运行在计算机上时,程序代码可操作用以执行其中一个方法。例如程序代码可以被储存在机器可读载体中。
[0169] 其他实施方法包括用于执行在此描述的、存储于机器可读载体上的其中一个方法的计算机程序。
[0170] 换句话,因而,本发明方法的实施例是具有程序代码的计算机程序,当该程序代码在计算机上运行时,用于执行在此描述的其中一个方法。
[0171] 本发明方法的更进一步的实施例为,数据载体(或数字储存媒介,或计算机可读媒介)包括储存其上的计算机程序,用于执行在此描述的其中一个方法。数据载体、数字储存媒介或储存媒介,一般来说是实体的和/或非临时性的。
[0172] 本发明方法的更进一步的实施例为,表示计算机程序的数据串流或信号序列,用于执行在此描述的其中一个方法。例如,数据串流或信号序列被配置用于通过数据通信连接,例如通过因特网,以进行传输。
[0173] 进一步的实施例包括处理装置,例如计算机或可编辑逻辑设备,被配置用于或被改编用于执行在此描述的其中一个方法。
[0174] 进一步的实施例包括具有安装计算机程序的计算机,用于执行在此描述的其中一个方法。
[0175] 根据本发明的进一步实施例,包括装置或系统,被配置用于传输(例如,电子或光学)计算机程序至接收端,计算机程序用于执行在此描述的其中一个方法。例如,接收端可以为计算机、移动装置、存储装置或其他类似装置。例如,该装置或系统可以包括文件服务器,用于传输计算机程序至接收端。
[0176] 在部分实施例中,可编程逻辑设备(例如,现场可编程阵列)可以用于执行在此处描述的方法的部分或全部功能。在部分实施例中,现场可编程门阵列可以与微处理器合作,以执行在此处描述的其中一个方法。一般来说,方法较佳地可以被任何硬件装置所执行。
[0177] 上述实施例仅用于说明本发明的原理。应当理解,本文所描述的安排的细节的修改和变化对于本领域的技术人员是显而易见的。因此,其意图是仅仅通过即将发生的专利权利要求范围来限制,而不是通过本文实施例的描述和解释的方式呈现的特定细节来限制。
[0178] 7.6进一步的实施例
[0179] 在下文中,参考图8描述根据本发明的另一实施例,图8显示所谓的混合残差解码器的方块示意图。
[0180] 根据图8的混合残差解码器800和根据图7的解码器700非常相似,使得其可参考以上的解释。然而,在混合残差解码器800中,附加的加权(除了升混合参数的应用)仅仅被应用至升混合解相关信号(在解码器700中对应于信号756,758),而没有应用到升混合残差信号(在解码器700中对应于信号760,762)。因此,混合残差解码器800中的权重器比解码器700中的权重器简单,但是一致地,例如根据公式(14)进行加权。
[0181] 在下文中,根据图8的结合的参数和残差解码(混合残差编码)将进行更多细节的解释。
[0182] 然而,首先,提供概述。
[0183] 除了使用以解相关器为基础的单声道至立体声升混合,或者如在ISO/IEC 23002-3,第7.11.1款所描述的残差编码,混合残差编码允许依赖两种模式结合的信号。如图8所示,根据信号能量和空间参数,使用时间和频率相关加权因子而将残差信号和解相关器输出混合在一起。
[0184] 在下文中,描述解码处理。
[0185] 混合残差编码模式通过Mps212Config( )中的语法分量bsResidualCoding==1以及bsResidualBands==1而指出。换句话说,混合残差编码的运用能够使用编码表示的位串流分量来进行信号化。如果bsResidualCoding==0,则将执行混合矩阵M2的计算,其遵守ISO/IEC23003-3第7.11.2.3款的计算,针对以部分为基础的解相关器的的矩阵 定义为
[0186]
[0187] 升混合处理被分成降混合、解相关器输出和残差。升混合降混合udmx使用以下公式计算:
[0188]
[0189] 升混合解相关器输出udec使用以下公式计算:
[0190]
[0191] 升混合残差信号ures使用以下公式计算:
[0192]
[0193] 升混合残差信号Eres、升混合解相关器输出Edec的能量在每个混合频带被计算为在输出声道chg和时隙ts上的总合:
[0194]
[0195]
[0196] 针对每个帧的每个混合频带,升混合解相关器输出使用如下所述的加权因子rdec进行加权:
[0197]
[0198] 其中ε为极小数字以防止被零相除(例如:ε=1e-9或是0<ε<=1e-5)。然而,在部分实施例中,ε可以被设定为零(用“Eres=0”取代“Eres<ε”)。
[0199] 所有三个升混合信号被加入以形成解码输出信号。
[0200] 8.结论
[0201] 总结来说,根据本发明的实施例建立了结合的残差和参数编码。
[0202] 本发明建立了方法,用于针对联合立体声编码的参数和残差编码的信号相关结合,且联合立体声编码是基于USAC统一立体声工具。取代使用固定的残差带宽,被传输的残差数量相依于编码器、时间及频率变量而决定信号。在解码器侧,在输出声道之间的解相关的需要数量由混合残差信号和解相关器输出所产生。如此一来,对应的音频编码/解码系统能够在运行时间根据编码信号,完全地在参数编码和波形保留残差编码之间进行混合。
[0203] 根据本发明的实施例优于传统的解决方案。例如,在USAC中,MPEG环绕2-1-2系统用于参数立体声编码或者统一立体声,其针对部分波形保存而传输有限频带或完整带宽的残差信号。如果有限频带残差被传输,使用解相关器的参数升混合应用到上述残差带宽上。该方法的缺点在于,在初始化编码器时,残差带宽被设定为固定值。
[0204] 相反,根据本发明的实施例,允许残差带宽的信号相关改编,或者切换至参数编码。而且,如果参数编码模式中的降混合处理针对不良情况的相位关系产生信号取消,根据本发明的实施例允许再建遗失的信号部分(例如,通过提供适当的残差信号)。值得一提的是,针对参数编码,简易降混合方法比传统MPS降混合产生更少的信号取消。然而,既然残差信号没有定义在USAC中,常规的简易降混合不能被使用于部分波形保存,根据本发明的实施例允许波形再建(例如,针对信号部分的选择性的部分波形再建,其中部分波形再建看来是重要的)。
[0205] 进一步总结,根据本发明的实施例建立了装置、方法或者计算机程序,用于在此处描述的音频编码或解码。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈