一种基于量化信号域的立体声及多声道编解码方法与系统

申请号 CN200510114198.7 申请日 2005-10-25 公开(公告)号 CN1787078A 公开(公告)日 2006-06-14
申请人 芯晟(北京)科技有限公司; 发明人 李迅; 陈水仙;
摘要 本 发明 是一种基于量化 信号 域的立体声及多声道编解码方法与系统。量化模 块 输入端连接频域处理模块,输出端与声道耦合模块和无损编码模块连接,声道耦合模块一端连接量化模块,另一端连接无损编码模块,用于对声道对进行变换耦合。将 音频信号 送入进行预处理并将按照频带对时域信号进行划分;将经过频带划分的频域信号进行频域处理;量化经频域处理的信号;去除声道对信号间的相关性冗余;对去除了相关性冗余的信号进行无损编码并将编码结果输出。本发明将声道耦合模块移动到量化模块后面来实现,不需重新计算 声学模型 参数,解决了量化噪声在声道间交织、声道 泄漏 和耦合后声学模型设计困难等问题,利于优化分析,设计复杂度低,灵活性高。
权利要求

1、一种基于量化信号域的立体声及多声道编码方法,该方法包括以 下步骤:
1)将经采样音频信号送入时域预处理模进行高通滤波、采样率 转换、比特深度转换和声道转换等预处理;
2)将经过预处理的音频信号按照频带对时域信号进行划分;
3)将经过频带划分的频域信号进行频域处理;
4)利用声学模型模块输出的声学掩蔽参数对经频域处理的信号进行 量化;
5)对经量化的信号进行声道耦合,去除声道对信号间的相关性冗余;
6)对去除了相关性冗余的信号进行无损编码,并将编码结果输出。
2、根据权利要求1所述的基于量化信号域的立体声及多声道编码方 法,其中,所述步骤5中的去除声道对信号间的相关性冗余采用变换耦 合方法。
3、根据权利要求2所述的基于量化信号域的立体声及多声道编码方 法,其特征在于,所述步骤5中的声道耦合是采用方极坐标映射来耦合。
4、根据权利要求2所述的基于量化信号域的立体声及多声道编码方 法,其中所述步骤5中的变换为整数变换。
5、根据权利要求1所述的基于量化信号域的立体声及多声道编码方 法,其中,所述步骤4的量化步骤还包括通过提取比例因子信息对信号 进行归一化处理的步骤,所述比例因子在步骤5中采用声道间差分编码 方式进行编码。
6、根据权利要求1所述的基于量化信号域的立体声及多声道编码方 法,其特征在于,所述步骤6进一步包括以下步骤:
6.1)、将未经声道耦合的信号送入声道耦合模块进行耦合,并将该 信号送到无损编码模块进行无损编码;
6.2)、无损编码模块对声道耦合模块输出的经过变换耦合的信号进 行无损编码;
6.3)、比较耦合后信号的无损编码比特数与未进行声道耦合信号的 无损编码比特数;
6.4)、判断耦合后编码比特数相对于未耦合的编码比特数是否减少, 减少则采用声道耦合编码方式,否则不采用声道耦合编码。
7、一种基于量化信号域的立体声及多声解码方法,该方法包括以下 步骤:
1).将接收到的编码信号在无损编码模块中进行传输格式的解封装, 并对解封装后的信号进行无损解码;
2).将上述无损解码后的信号在声道解耦合模块中进行声道解耦合;
3).对解耦合后的信号在解量化模块中利用编码端传输的量化步长 进行解量化;
4).根据编码端的处理在频域反处理模中进行与编码端相应的逆向 操作,并将得到的信号送入滤波器组/时频反变换模块;
5).对从频域反处理模块输出的信号在滤波器组/时频变换模块中 进行反变换;
6).将从滤波器组/时频变换模块输出的时域信号在时域后处理模 块中进行后处理,并将处理后的信号送入到音频发生器。
8、根据权利要求7所述的基于量化信号域的立体声及多声道解码方 法,其中,所述步骤2中的解耦合是采用变换耦合来进行。
9、根据权利要求8所述的基于量化信号域的立体声及多声道解码方 法,其特征在于,所述步骤2中的声道解耦合是采用方极坐标映射来进 行。
10、根据权利要求8所述的基于量化信号域的立体声及多声道解码 方法,其中所述步骤2中所采用的变换为整数变换。
11、根据权利要求7所述的基于量化信号域的立体声及多声道解码 方法,其中,所述步骤3的解量化步骤还包括通过提取比例因子信息对 信号进行反归一化处理的步骤,所述比例因子在步骤2中采用声道间差 分编码方式进行编码。
12、根据权利要求7所述的基于量化信号域的立体声及多声道解码 方法,其特征在于,所述步骤2进一步包括以下步骤:
2.1)、声道解耦合模块根据耦合标志信息,对从无损解码模块输出 的无损解码后的信号进行声道解耦合,当耦合标志信息指示启用声道耦 合时,对其进行解耦合处理,否则直接将信号传递到解量化模块。
13、一种基于量化信号域的立体声及多声道编码系统,包括音频信 号采样器、声学模型模块、时域预处理模块、滤波器组/时频变换模块、 频域处理模块、量化模块,声道耦合模块和无损编码模块,其特征在于,
所述音频信号采样器,用于将经采样的音频信号送入所述时域预处 理模块;
所述时域预处理模块,对输入的采样信号进行高通滤波、采样率转 换、比特深度转换和声道转换等预处理;
所述滤波器组/时频变换模块,将经过预处理的音频信号按照频带对 时域信号进行划分;
所述频域处理模块,将经过频带划分的频域信号进行频域处理;
所述量化模块,其输入端连接频域处理模块,输出端与声道耦合模 块连接,用于利用声学模型模块输出的声学掩蔽参数对经频域处理的音 频信号进行量化;
所述声道耦合模块,一端连接量化模块,另一端连接无损编码模块, 对经量化的信号进行声道耦合,去除声道对信号间的相关性冗余;
所述无损编码模块,对去除了相关性冗余的信号进行无损编码,并 将编码结果输出。
14、根据权利要求13所述的基于量化信号域的立体声及多声道编码 系统,其中,所述声道耦合模块采用变换耦合来去除声道对信号间的相 关性冗余。
15、根据权利要求14所述的基于量化信号域的立体声及多声道编码 方法,其特征在于,所述声道耦合模块采用方极坐标映射来进行声道耦 合。
16、根据权利要求14所述的基于量化信号域的立体声及多声道编码 系统,其中所述声道耦合模块采用的变换为整数变换。
17、根据权利要求13所述的基于量化信号域的立体声及多声道编码 系统,其中,
所述量化模块,还包括通过提取比例因子信息对信号进行归一化处 理,所述比例因子在所述无损编码模块中采用声道间差分编码方式进行 编码。
18、根据权利要求13所述的基于量化信号域的立体声及多声道编码 系统,其特征在于,
所述声道耦合模块,将未经声道耦合的信号在声道耦合模块中进行 耦合,还将该未经声道耦合的信号送到无损编码模块进行无损编码;
所述无损编码模块,对声道耦合模块输出的经过变换耦合的信号进 行无损编码;比较耦合后信号的无损编码比特数与未进行声道耦合信号 的无损编码比特数;判断耦合后编码比特数相对于未耦合的编码比特数 是否减少,减少则采用声道耦合编码方式,否则不采用声道耦合编码。
19、一种基于量化信号域的立体声及多声道解码系统,包括无损解 码模块、声道解耦合模块、解量化模块、频域反处理模块、滤波器组/时 频变换模块、时域后处理模块,其特征在于,
所述无损解码模块,用于将接收到的编码信号进行传输格式的解封 装,并对解封装后的信号进行无损解码;
所述声道解耦合模块,其一端连接无损解码模块,另一端连接解量 化模块,用于将上述无损解码后的信号在声道解耦合模块中进行声道解 耦合;
所述解量化模块,其输入端分别与声道解耦合模块和无损解码模块 连接,输出端连接频域处理模块,用于对解耦合后的信号在解量化模块 中利用编码端传输的量化步长进行反量化;
所述频域反处理模块,根据编码端的处理进行与编码端相应的逆向 操作,并将得到的信号送入滤波器组/时频反变换模块;
所述滤波器组/时频变换模块,对从频域反处理模块输出的信号进行 反变换;
所述时域后处理模块,将从滤波器组/时频变换模块输出的时域信号 在时域后处理模块中进行后处理,并将处理后的信号送入到音频发生器;
所述音频发生器,将从时域后处理模块输出的处理后的信号由作为 音频信号输出。
20、根据权利要求19所述的基于量化信号域的立体声及多声道解码 系统,其中,所述声道解耦合模块中的解耦合是采用变换耦合来进行。
21、根据权利要求20所述的基于量化信号域的立体声及多声道解码 系统,其特征在于,所述声道解耦合模块中的声道解耦合是采用方极坐标 映射来进行。
22、根据权利要求20所述的基于量化信号域的立体声及多声道解码 系统,其中所述声道解耦合模块中所采用的变换为整数变换。
23、根据权利要求19所述的基于量化信号域的立体声及多声道解码 系统,其中,所述解量化模块中进行的解量化包括通过提取比例因子信 息对信号进行反归一化处理,所述比例因子在声道解耦合模块中采用声 道间差分编码方式进行编码。
24、根据权利要求19所述的基于量化信号域的立体声及多声道解码 系统,其特征在于:
所述声道解耦合模块,根据耦合标志信息,对从无损解码模块输出 的无损解码后的信号进行声道解耦合,当耦合标志信息指示启用声道耦 合时,对其进行解耦合处理,否则直接将信号传递到解量化模块。

说明书全文

技术领域

发明属于立体声/多声道编码技术领域,具体地说是一种基于量化 信号域的立体声及多声道编解码方法与系统。

技术背景

与单声道编码不同,立体声及多声道编码除了可以利用声道信号本 身的冗余和声学掩蔽特性来达到压缩目的外,往往还可以利用声道间的 相关性冗余和互掩蔽效应来进一步压缩,因此立体声及多声道编码往往 能够以比独立声道编码更低的编码速率达到相同的编码质量。这种技术 一般称为声道耦合技术,在立体声环境也被称为立体声编码技术。

目前常用的声道耦合技术可以分为两大类。一类是在输入信号的变 换域上实现声道耦合,去除声道间冗余;另一类是在墒编码过程中,通 过联合墒编码的方式来实现去除声道间冗余。这两类又可以分别分为有 损耦合和无损耦合。

第一类声道耦合技术如图1所示。这类声道耦合技术是目前应用最 广泛的立体声及多声道编码技术。其中以和/差(M/S)联合立体声编码 技术为代表,约翰斯顿(Johnston,J.D.)和费里拉(Ferreira,A.J.) 1992年在音频、语音和信号处理国际会议(ICASSP)上发表的《和/差 立体声变换编码》一文中研究了这种联合立体声编码技术;属于开源计 划的音频编码器Ogg Vorbis中采用的方极坐标映射也属于其中的一种之 一。这种声道耦合技术是在原始信号的变换域上实现声道耦合,其优点 是参与耦合的值没有经过缩放,耦合精度较高。但是,由于耦合是在量 化前做的,这就改变了量化模的输入信号,因此需要对将用于量化模 块的声学掩蔽参数进行重新计算和调整。这就带来了几个问题:1、对于 耦合后的声道需要重新设计声学模型,而目前对自然声音的声学模型内 在机理尚且未被完全认识,对这类人为耦合的声音更只能通过试验的方 法进行逼近。对于一些如方极坐标映射之类的非线性变换,耦合后声学 模型的设计就更加麻烦。2、在解码端,声道解耦合将导致量化误差在声 道间交叉分布,导致声道泄漏和合成质量下降。3、由于耦合的声道值没 有经过缩放,因此声道间的强度差异往往直接影响耦合去相关性的效果。

另一类声道耦合技术是通过联合墒编码的方式去除相关性冗余,如 采用多维联合码本技术。此类声道耦合技术将声道耦合和墒编码联系在 一起,虽然和本专利中的方案一样,回避了上述所述的问题,但一方面 声道耦合方式受制于墒编码形式,约束了去声道间冗余的技术选择,另 一方面也增加了墒编码的设计复杂度,码本的存储空间以及实现的硬件 代价。此外这类声道耦合技术和传统的声道耦合方案之间也存在着兼容 性的问题。

发明内容

为了克服现有技术中的不足,本发明的目的在于提供一种基于量化 信号域的立体声及多声道编解码方法与系统,以解决量化噪声在声道间 交织和声道泄漏问题。
本发明的再一个目的在于提供一种基于量化信号域的立体声及多声 道编解码方法与系统,以避免耦合后声学模型的重新设计。
本发明的第三个目的在于提供一种基于量化信号域的立体声及多声 道编解码方法与系统,进一步提高多声道及立体声编码的压缩效率。
为完成上述发明目的,本发明提供一种基于量化信号域的立体声及 多声道编码方法,该方法包括以下步骤:
1)将经采样音频信号送入时域预处理模块进行高通滤波、采样率 转换、比特深度转换和声道转换等预处理,将经过预处理的音频信号按 照频带对时域信号进行划分;
2)将经过频带划分的频域信号进行频域处理;
3)利用声学模型模块输出的声学掩蔽参数对经频域处理的信号进行 量化;
4)对经量化的信号进行声道耦合,去除声道对信号间的相关性冗余;
5)对去除了相关性冗余的信号进行无损编码,并将编码结果输出。
为完成上述发明目的,本发明还提供一种基于量化信号域的立体声 及多声解码方法,该方法包括以下步骤:
1).将接收到的编码信号在无损编码模块中进行传输格式的解封装, 并对解封装后的信号进行无损解码;
2).将上述无损解码后的信号在声道解耦合模块中进行声道解耦合;
3).对解耦合后的信号在解量化模块中利用编码端传输的量化步长 进行反量化;
4).块根据编码端的处理在频域反处理模中进行与编码端相应的逆 向操作,并将得到的信号送入滤波器组/时频反变换模块;
5).对从频域反处理模块输出的信号在滤波器组/时频变换模块中 进行反变换;
6).将从滤波器组/时频变换模块输出的时域信号在时域后处理模 块中进行后处理,并将处理后的信号送入到音频发生器。
为完成上述发明目的,本发明还提供一种基于量化信号域的立体声 及多声道编码系统,包括音频信号采样器、声学模型模块、时域预处理 模块、滤波器组/时频变换模块、频域处理模块、量化模块,声道耦合模 块和无损编码模块,其特征在于,
所述音频信号采样器,用于将经采样的音频信号送入所述时域预处 理模块;
所述时域预处理模块,对输入的采样信号进行高通滤波、采样率转 换、比特深度转换和声道转换等预处理;
所述滤波器组/时频变换模块,将经过预处理的音频信号按照频带对 时域信号进行划分;
所述频域处理模块,将经过频带划分的频域信号进行频域处理;
所述量化模块,其输入端连接频域处理模块,输出端与声道耦合模 块连接,用于利用声学模型模块输出的声学掩蔽参数对经频域处理的音 频信号进行量化;
所述声道耦合模块,一端连接量化模块,另一端连接无损编码模块, 对经量化的信号进行声道耦合,去除声道对信号间的相关性冗余;
所述无损编码模块,对去除了相关性冗余的信号进行无损编码,并 将编码结果输出。
为完成上述发明目的,本发明还提供一种基于量化信号域的立体声 及多声道解码系统,包括无损解码模块、声道解耦合模块、解量化模块、 频域反处理模块、滤波器组/时频变换模块、时域后处理模块,其特征在 于:
所述无损解码模块,用于将接收到的编码信号进行传输格式的解封 装,并对解封装后的信号进行无损解码;
所述声道解耦合模块,其一端连接无损解码模块,另一端连接解量 化模块,用于将上述无损解码后的信号在声道解耦合模块中进行声道解 耦合;
所述解量化模块,其输入端分别与声道解耦合模块和无损解码模块 连接,输出端连接频域处理模块,用于对解耦合后的信号在解量化模块 中利用编码端传输的量化步长进行反量化;
所述频域反处理模块,根据编码端的处理进行与编码端相应的逆向 操作,并将得到的信号送入滤波器组/时频反变换模块;
所述滤波器组/时频变换模块,对从频域反处理模块输出的信号进行 反变换;
所述时域后处理模块,将从滤波器组/时频变换模块输出的时域信号 在时域后处理模块中进行后处理,并将处理后的信号送入到音频发生器;
所述音频发生器,将从时域后处理模块输出的处理后的信号由作为 音频信号输出。
本发明具有明显的优点和积极效果。与传统的声道耦合技术相比, 本发明将声道耦合模块移动到量化模块后面来实现,即在量化信号域上 进行声道耦合。1、由于这种耦合方式没有改变量化模块的输入,因此不 需要对量化模块中所用到的声学模型参数进行重新计算。目前人们对于 声学掩蔽模型的内在机理认识还不是非常充分,对于耦合后的这种人为 信号的掩蔽模型认识就更不清楚。不用对耦合信号更新声学掩蔽参数可 以有效地回避由不准确的参数估计所带来的编码增益降低。2、在解码端, 由于声道解耦合也是在量化信号域上进行的,不引入量化噪声,因此有 效地解决了量化噪声在声道间交织和声道泄漏等问题。3、由于在量化过 程中一般都会通过提取比例因子之类的信息对信号进行归一化处理,因 此在量化信号域上进行声道耦合处理可以有效回避由于左右声道强度差 异而导致的耦合效果降低问题。4、本发明将去声道相关性冗余和立体声 及多声道声学模型设计分离开来,有利于分别对其进行优化分析,降低 了设计复杂度,提供了更强的灵活性。在对立体声及多声道声学模型机 理和设计充分认识的前提下,引入声道间互掩蔽效还可以进一步提高压 缩效率。与联合墒编码技术相比,本发明实现去声道间冗余的技术手段 仍然是现有技术中的变换耦合,去声道相关性冗余的效果取决于变换的 正交性,而不是联合墒编码的方式。差分编码是其中的一个特例,它既 可以被认为是墒编码的一种,同时也是正交变换的一种,但是本发明的 基本原理与联合墒编码技术是不同的,两者有交集,但都不能被对方所 包括。其次,从结构上来说,本发明的声道耦合模块与无损墒编码是两 个独立的模块,本发明中的声道耦合模块可以是有损的,也可以是无损 的,这大大提高了灵活性。再次,由于本发明仍然通过变换耦合的方式 去除声道间的相关性冗余,因此本发明完全兼容现有的立体声及多声道 耦合技术,传统声道耦合技术中采用的声道耦合映射算法可以直接应用 于本发明中。
本发明具体实施方式中提供了一种基于量化信号域(PQCC)的改进 方极坐标耦合方法,该方法能有效去除声道间的相关性冗余,且其实现 也较简单。而原来的方极坐标(SPSC)的性能与立体声声学模型的设计 存在较大关系,当立体声声学模型设计合理时,PQCC和SPSC的编码性 能相当,PQCC同样也可以利用立体声声学模型中的左右声道互掩蔽效应, 但PQCC将去除声道相关性冗余和立体声声学模型分开,具有更好的灵活 性。采用该方法可以有效地解决现有技术中存在的耦合声道声学模型设 计困难、声道间存在泄漏和量化噪声交织的问题以及声道间强度差异对 声道耦合效果的影响问题,此外,本发明的方法将去声道间相关性冗余 和立体声及多声道声学模型分离开来,降低了设计复杂度,灵活性强。
附图说明
图1为传统声道耦合技术的实现结构示意图;
图2为本发明系统原理构成图;
图3为根据本发明的基于量化信号域的立体声及多声道编码方法的 流程图
图4为根据本发明的基于量化信号域的立体声及多声道解码方法的 流程图;
图5为根据本发明最佳实施例的基于量化信号域的方极坐标编码方 法流程图;
图6为启用声道耦合的判决框图
图7为PQCC、SPSC和独立双声道编码的ODG得分示意图。
图8为图7所示的来源于MPEG组织的标准测试序列的12个测试序 列。

具体实施方式

下面结合说明书附图来说明本发明的具体实施方式。
图2是本发明的系统构成图,参见图2,本发明的系统构成包括编 码系统和解码系统两部分。根据本发明的基于量化信号域的立体声及多 声道编码系统包括以下装置:
音频信号采样器,其输出端与预处理模块和声学模型模块相连,用 于采集声音信号,并送入时域预处理模块和声学模型模块。
时域预处理模块,其输入端连接音频信号采样器,输出端与滤波器 组/时频变换模块相连,用于将音频信号进行预处理,如高通滤波、采样 率转换、比特深度转换和声道转换等。高通滤波是将低频滤去的一种滤 波技术。采样率转换的作用是将一种采样率转换为另一种采样率。比特 深度转换是将不同的输入比特深度转换为编码器要求的比特深度。声道 转换是将输入的声道数转换为编码器所要求的声道数。
滤波器组/时频变换模块,其输入端连接时域预处理模块,输出端与 频域处理模块连接,用于按照频带对时域信号进行划分。主要方法是将 经过预处理的音频信号变换到频域上或者进行带通滤波。滤波器组和时 频变换是并列的两种技术,可以单独使用也可以联合使用,这两种技术 的目的都是将时域信号按照频带划分,滤波器组是利用一系列互相相邻 的带通滤波器来实现其功能的,时频变换是利用正交变换来实现的。
频域处理模块,其输入端连接滤波器组/时频变换模块,输出端与量 化模块相连,用于将经过带通滤波或者时频变换的频域信号进行频域处 理,如噪声整形和频域预测等。噪声整形的目的是使噪声主要集中到掩 蔽能强的信号位置,在信号掩蔽能力弱的位置减少噪声的生成,频域 预测是通过线性预测去掉信号间的相关性。
量化模块,其输入端连接频域处理模块,输出端分别与声道耦合模 块和无损编码模块连接,用于利用声学模型模块输出的声学掩蔽参数对 经频域处理的信号进行量化,并送入声道耦合模块和无损编码模块。不 考虑速率控制的量化模块是一个量化器,用预定的步长对其进行量化。
声道耦合模块,其输入端连接量化模块,输出端连接无损编码模块, 用于去除声道对信号之间的相关性冗余。其主要方法是通过变换耦合去 除相关性冗余,优选的耦合方式为正交变换耦合。通过变换耦合可以将 原来在多个声道中重复存在的冗余信息映射到同一个域上,从而减少了 信号间的相关性,变换的正交性决定了这种去除相关性冗余的效果。
无损编码模块,其输入端连接声道耦合模块,用于对去除了声道间 相关性冗余的信号进行无损编码,并将编码结果按传输所需要的格式进 行封装输出。最简单的无损编码模块的功能就是查表操作。
参见图2,根据本发明的一种基于量化信号域的立体声及多声道解 码系统,包括以下装置:无损解码模块、声道解耦合模块、解量化模块、 频域反处理模块、滤波器组/时频反变换模块、时域后处理模块和音频信 号发生器。
无损解码模块执行编码端无损编码模块的逆处理,其输出端与声道 解耦合模块连接,用于将传输格式解封装,并对解封装后信号进行无损 解码。
声道解耦合模块执行编码端声道耦合模块的逆处理,其输入端连接 无损解码模块,输出端连接解量化模块,用于对无损解码后的信号进行 解耦合。
解量化模块执行编码端量化模块的逆处理,其输入端与声道解耦合 模块连接,输出端连接频域反处理模块,用于将解耦合后的信号进行反 量化。
频域反处理模块执行编码端频域处理模块的逆处理,其输入端连接 解量化模块,输出端连接滤波器组/时频反变换模块,用于将解量化的信 号按照编码端的处理进行与其相应的逆向操作,并将得到的信号送往滤 波器组/时频反变换模块。
滤波器组/时频反变换模块执行编码端滤波器组/时频变换模块的逆 处理,其输入端与频域反处理模块连接,输出端与时域后处理模块连接。 用于对频域反处理模块输出的经过频域反处理的信号进行逆滤波或者时 频反变换,并将输出的时域信号送往时域后处理模块。
时域后处理模块,其输入端与滤波器组/时频反变换模块连接,输出 端直接与音频信号发生器连接,用于按照输出设备和应用环境的需要对 时域信号进行各种转换或者增强处理,最后将符合要求的音频信号送往 音频信号发生器。
音频信号发生器代表了音频信号的播放或者存储操作,其输入端与 时域后处理模块连接。
图3为根据本发明的基于量化信号域的立体声及多声道编码方法的 流程图。下文将参考图3,对本发明的立体声及多声道编码方法进行详 细描述。
首先,在步骤301,对输入的音频信号进行采样,并将采样所得的 音频信号送入时域预处理模块和声学模型模块。
在步骤302,时域预处理模块对采样后的音频信号进行预处理,预 处理包括高通滤波、采样率转换、比特深度转换和声道转换等。并将经 过预处理的信号送入声学模型模块。
然后,在步骤303,滤波器组/时频变换模块将在步骤302中经过预 处理的音频信号变换到频域上或进行带通滤波,按照频带对时域信号进 行划分。
在步骤304,频域处理模块将经过频带划分的频域信号进行频域处 理。之后,流程进入到步骤305。
在步骤305,量化模块利用声学模型模块输出的声学掩蔽参数对经 频域处理的信号进行量化,并送入声道耦合模块和无损编码模块。掩蔽 参数为声学模型根据输入信号计算所得的人在当前信号下对噪声的敏 感程度,量化模块根据该参数并结合输出速率的要求确定当前的量化精 度。量化过程中包括通过提取比例因子信息对信号进行归一化处理的步 骤。归一化过程可描述为:假设比例因子为SF,归一化前信号为x,则 归一化后信号为x/f(SF),其中f(SF)为变量SF的函数。
在步骤306,声道耦合模块去除声道对信号间的相关性冗余,其常 用正交变换耦合技术。最后,在步骤307,无损编码模块对声道耦合后 的信号进行无损编码,并将编码结果按所需的传输格式进行封装输出。
图4为根据本发明的基于量化信号域的立体声及多声道解码方法的 流程图。下面将参考图4,对本发明的立体声及多声道解编码方法进行 详细描述。
首先,在步骤401,无损解码模块对传输格式进行解封装,并对解 封装后的信号进行无损解码,分别提取出量化频谱、耦合标志信息、量 化步长信息以及其他辅助信息。
然后,在步骤402,声道解耦合模块根据耦合标志信息,对从无损 解码模块输出的无损解码后的信号进行声道解耦合,当耦合标志信息指 示启用声道耦合时,对其进行解耦合处理,否则直接将信号传递到解量 化模块。
在步骤403,解量化模块根据量化步长信息,对解耦合后的信号进 行反量化,解量化后,流程进入到步骤404。
接下来,在步骤404,频域反处理模块根据辅助信息,按照编码端 的处理进行与编码端相应的逆向操作,并将得到的信号送入滤波器组/时 频反变换模块;
在步骤405,滤波器组/时频变换模块对从频域反处理模块输出的信 号进行反变换。
在步骤406,时域后处理模块将从滤波器组/时频变换模块输出的时 域信号进行后处理,并将处理后的信号送入到音频发生器。
最后,在步骤407,音频发生器将从时域后处理模块输出的处理后 的信号作为音频信号输出。
图5为根据本发明实施例的基于量化信号域的方极坐标编码系统框 图。参见图5,其中示出了根据本发明最佳实施例的采用改进的方极坐 标立体声编码技术而实现的基于量化信号域的立体声及多声道编码系 统。
方极坐标映射如下所示,式(1)为编码端的耦合公式,式(2)为 解码端的解耦合公式。
m a = l abs ( l - r ) , abs ( l ) > abs ( r ) r - abs ( l - r ) , else - - - ( 1 )
l r = m m - sign ( m ) * a , a > 0 m + sign ( m ) * a m , else - - - ( 2 )
由上述两式可以看出,这种变换映射与和/差(M/S)映射不同,是 一种非革命线性的映射关系,并且存在着声道间的混叠,因此,传统声 道耦合框架中存在的问题对其影响将更加严重,从而降低去相关性冗余 所带来的编码增益。采用本发明的基于量化信号域的立体声及多声道编 码方法可以有效避免这些问题,并且便于实现和优化。
下面参照图5描述本实施例的改进的方极坐标立体声编解码系统:
如图5所示,改进的方极坐标立体声编解码系统主要包括:时域预 处理模块,时域后处理模块,滤波器组/时频变换模块,滤波器组/时频 反变换模块,声学模型模块,频域处理模块,频域反处理模块,量化模 块,反量化模块,声道耦合模块,无损编码模块,无损解码模块等。
时域预处理模块,该模块将输入音频信号进行高通滤波,采样率转 换、比特深度转换,声道转换等预处理操作。位于本系统解码端的时域 后处理模块,它是上述时域预处理模块在解码端的对应模块,但并不一 定完全为其逆操作。时域后处理模块除了执行时域预处理模块中必要的 逆操作以外,还根据输出音频设备的要求,对其输入信号进行相应的格 式转换以及增强处理。
经过预处理的音频信号由滤波器组/时频变换模块变换到频域上或进 行带通滤波,划分信号的频带。位于该系统解码端的滤波器组/时频反变 换模块执行上述滤波器组/时频变换模块的逆操作。
声学模型模块利用输入音频信号根据音频的声学机理和试验模型提 取声学掩蔽参数,该掩蔽参数将作为指导信息,用于量化模块的量化过 程。
经过带通滤波或者时频变换的频域信号利用频域处理模块进行噪声 整形、频域预测等频域处理。位于该系统解码端的频域反处理模块为其 逆模块。
量化模块利用声学模型模块输出的声学掩蔽参数对频域处理模块的 输出信号进行量化。解码端的反量化模块为其逆模块。
声道耦合模块包括两部分,分别执行声道耦合判决操作和声道之间 的变换耦合。当判决模块经判决后启用变换耦合时(下文将详细描述该 操作过程),声道耦合模块进行变换耦合,并输出耦合后信号,否则直接 输出输入信号。解码端的声道解耦合模块为其逆模块,负责声道之间的 解耦合。在改进的方极坐标立体声编解码方案中,此处采用方极坐标映 射方式,但这只是一个示例,其他变换同样适用于声道耦合模块。当编 码为多声道编码时,所需变动只是变换维数的增加而已。
无损编码模块负责将信号进行无损编码压缩,并将编码结果封装成 传输所需要的格式。解码端的无损解码模块为其逆模块。
是否启用声道耦合的判决过程可以根据图6所示的声道耦合模块中 声道耦合判决的流程图来决定。将未耦合的信号送入声道耦合模块进行 耦合,并将该信号送到无损编码模块进行无损编码;无损编码模块对声 道耦合模块输出的耦合后信号进行无损编码;比较耦合信号的编码比特 数与未耦合信号的编码比特数;判断耦合后编码比特数是否减少,减少 则采用声道耦合编码方式,否则不采用声道耦合编码。
在本发明的无损编码模块中,当采用声道耦合编码模式时,为了进 一步提高编码效率,对量化模块中提取的归一化因子采取声道间差分编 码的方案。
假设声道0的第m个归一化因子为N(0,m),声道1的第m个归一化因 子为N(1,m),则差分编码后的归一化因子为
N ( 0 , m ) = N ( 0 , m ) - N ( 0 , m - 1 ) N ( 1 , m ) = N ( 1 , m ) - N ( 0 , m )
即主声道的归一化因子按照常规的差分编码进行,耦合声道的归一 化因子在声道间进行差分编码。
图7给出了改进的基于量化信号域的立体声及多声道编码方法 (PQCC,Post-quantization coupling coding)、方极坐标立体声编码 (SPSC,Square-polar stereo coding)和独立双声道编码(dual-channel coding)的客观损伤等级(ODG,objective degradation grade)示意图。 参见图7,比较的双方都是基于相同的声学模型即国际标准化组织ISO 声学模型II,所不同的只在于声道耦合模块的处理过程。本发明采用评 估方式得出的客观损伤等级(ODG)对编码结果进行比较。PQCC方法、SPSC 方法的平均ODG得分分别为-1.16,-1.53。本发明的方案要明显优于原 来的SPSC方法,其关键之处在于原来方极坐标映射的声学模型设计困 难,部分序列采用SPSC耦合后编码质量反而不如采用独立双声道的编码 结果,参见图8中的sc01,sc03,sm01,sm02,sm03序列(序列所对应的 音频内容见图8的附表)。
试验结果证明,声道间的相关性在量化信号域上仍能得到有效的保 持,本发明的基于量化信号域的声道耦合方法是可行的。在理论上,当 SPSC的耦合信号声学模型设计合理时,SPSC的编码质量与本发明中的编 码方案的编码质量是相当的,而且本发明中的PQCC方案同样可以利用立 体声声学模型中的左右声道互掩蔽效应,只需在设计声学模型时将其考 虑在内即可。但是由于本发明中将去除声道间相关性冗余和立体声及多 声道声学模型分离开来,降低了设计复杂度,其实现要更简单灵活,且 易于实施。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对 于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明 的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在 本发明的权利要求范围之内。
QQ群二维码
意见反馈