首页 / 专利库 / 物理 / 能量 / 用于针对高频带宽扩展进行编码/解码的设备和方法

用于针对高频带宽扩展进行编码/解码的设备和方法

阅读:724发布:2024-01-24

专利汇可以提供用于针对高频带宽扩展进行编码/解码的设备和方法专利检索,专利查询,专利分析的服务。并且一种用于针对高频带宽扩展执行编码和解码的方法和设备。所述编码设备可对输入 信号 进行下 采样 ,对 下采样 的 输入信号 执行核心编码,对输入信号执行 频率 变换,并通过使用频域中的输入信号的基信号来执行带宽扩展编码。,下面是用于针对高频带宽扩展进行编码/解码的设备和方法专利的具体信息内容。

1.一种编码方法,包括:
基于输入信号的低频信号的特征来确定输入信号的低频信号的核心编码模式;
从输入信号的低频信号提取线性预测系数,并对线性预测系数进行量化;
当输入信号的低频信号的核心编码模式被确定为码激励线性预测编码模式时,通过使用至少一个处理器对输入信号的低频信号的线性预测系数激励信号执行码激励线性预测编码;
当对所述线性预测系数激励信号执行了码激励线性预测编码时,对输入信号的高频信号执行时域扩展编码;
当输入信号的低频信号的核心编码模式被确定为音频编码模式时,对所述线性预测系数激励信号执行音频编码;
当对所述线性预测系数激励信号执行了音频编码时,对输入信号的高频信号执行频域扩展编码。
2.如权利要求1所述的编码方法,其中,执行频域扩展编码的步骤包括:
使用输入信号产生针对高频带的基激励信号;
使用基激励信号和输入信号来获得能量控制因子;
从输入信号获得能量;
基于能量控制因子来控制所述能量;
对控制的能量进行量化。
3.如权利要求1所述的编码方法,其中,执行频域扩展编码的步骤包括:通过以不同比特率共享相同的码本来执行能量量化。
4.如权利要求1所述的编码方法,其中,根据对变换的输入信号执行音频编码的结果的比特率包括先前模式信息。
5.如权利要求2所述的编码方法,其中,在对控制的能量进行量化的操作中,所述能量被矢量量化。
6.如权利要求2所述的编码方法,其中,获得能量控制因子的步骤是基于基激励信号的音调和输入信号的音调之间的比率进行的。
7.一种解码方法,包括:
检查包括在比特流中的每个帧的模式信息;
当基于所述检查的结果,低频信号的核心编码模式指示码激励线性预测编码模式时,对码激励线性预测编码的帧执行码激励线性预测解码;
通过使用执行码激励线性预测解码的结果以及低频信号的激励信号中的至少一个,产生高频频带的解码信号;
当基于所述检查的结果,低频信号的核心编码模式指示音频编码模式时,对音频编码的帧执行音频解码;
通过使用执行音频解码的结果执行频域扩展解码来产生高频频带的解码信号。
8.如权利要求7所述的解码方法,其中,执行频域扩展解码的步骤包括:
对时域输入信号的能量进行反量化;
使用频域输入信号来产生基激励信号;
使用反量化的能量和基激励信号的能量来计算增益;
将计算的增益应用于每个频带的基激励信号。
9.如权利要求8所述的解码方法,其中,对能量进行反量化的步骤是通过以不同的比特率共享相同的码本来执行的。
10.如权利要求8所述的解码方法,其中,对能量进行反量化的步骤包括:选择能量矢量的子矢量,对选择的子矢量进行反量化,对反量化的子矢量进行插值,并将插值误差值添加到经过插值的子矢量。
11.如权利要求8所述的解码方法,其中,计算增益的步骤包括:设置用于应用能量平滑的子频带,并通过插值来产生每个子频带的能量,其中,所述增益是针对每个子频带计算的。

说明书全文

用于针对高频带宽扩展进行编码/解码的设备和方法

[0001] 本申请是向中国知识产权局提交的申请日为2011年12月28日的标题为“用于针对高频带宽扩展进行编码/解码的设备和方法”的第201180068757.9号申请的分案申请。

技术领域

[0002] 本发明的一个或多个方面涉及一种用于对音频信号(例如,语音信号或音乐信号)进行编码和解码的方法和设备,更具体地说,涉及一种用于对与音频信号的高频频带相应的信号进行编码和解码的方法和设备。

背景技术

[0003] 与高频频带相应的信号比与低频频带相应的信号对频率的精细结构更不敏感。因此,当提高编码效率以消除关于可用于对音频信号进行编码的比特的限制时,大量比特被分配给与低频频带相应的信号,并且相对少量的比特被分配给与高频频带相应的信号。
[0004] 采用上述方法的技术是频带复制(SBR)。在SBR中,通过用包络表现高频信号并且在解码处理期间合成所述包络来提高编码效率。SBR基于人对于高频信号具有相对低的分辨率的听觉特点。

发明内容

[0005] 技术问题
[0006] 本发明提供基于频带复制(SBR)来扩展高频频带的带宽的方法。
[0007] 技术解决方案
[0008] 根据本发明的一方面,提供一种编码设备,包括:下采样器,用于对输入信号进行下采样;核心编码器,用于对下采样的输入信号执行核心编码;频率变换器,用于对输入信号执行频率变换;扩展编码器,用于通过使用频域中的输入信号的基信号执行带宽扩展编码。
[0009] 根据本发明的另一方面,提供一种编码设备,包括:下采样器,用于对输入信号进行下采样;核心编码器,用于对下采样的输入信号执行核心编码;频率变换器,用于对输入信号执行频率变换;扩展编码器,用于通过使用频域中的输入信号和输入信号的基信号的特征来执行带宽扩展编码。
[0010] 根据本发明的另一方面,提供一种编码设备,包括:编码模式选择器,用于基于频域中的输入信号和时域中的输入信号选择用于执行带宽扩展编码的编码模式;扩展编码器,用于通过使用频域中的输入信号和所述编码模式来执行带宽扩展编码。
[0011] 扩展编码器可包括:基信号产生器,用于从频域中的输入信号的频谱产生频域中的输入信号的基信号;因子估计器,用于通过使用所述基信号估计能量控制因子;能量提取器,用于从频域中的输入信号提取能量;能量控制器,用于通过使用能量控制因子控制提取的能量;能量量化器,用于对控制的能量进行量化。
[0012] 扩展编码器可包括:基信号产生器,用于通过使用频域中的输入信号的频谱来产生频域中的输入信号的基信号;因子估计器,用于基于通过使用输入信号和基信号的特征来估计能量控制因子;能量提取器,用于从频域中的输入信号提取能量;能量控制器,用于通过使用能量控制因子控制提取的能量;能量量化器,用于对控制的能量进行量化。
[0013] 扩展编码器可包括:能量提取器,用于基于编码模式从频域中的输入信号提取能量;能量控制器,用于基于编码模式,通过使用能量控制因子控制提取的能量;能量量化器,用于基于编码模式对控制的能量进行量化。
[0014] 基信号产生器可包括:人工信号产生器,用于通过复制并折叠频域中的输入信号的低频域低频频带来产生与高频域高频频带相应的人工信号;包络估计器,用于通过使用窗口估计基信号的包络;包络应用单元,用于对人工信号应用估计的包络。
[0015] 因子估计器可包括:第一音调计算器,用于计算频域中的输入信号的高频域高频频带的音调;第二音调计算器,用于计算基信号的音调;因子计算器,用于通过使用频域中的输入信号的高频域高频频带的音调和基信号的音调来计算能量控制因子。
[0016] 根据本发明的另一方面,提供一种编码设备包括:信号分类单元,用于基于输入信号的特征来确定输入信号的编码模式;码激励线性预测(CELP)编码器,用于当输入信号的编码模式被确定为CELP编码模式时,对输入信号的低频信号执行CELP编码;时域(TD)扩展编码器,用于当对输入信号的低频信号执行CELP编码时,对输入信号的高频信号执行扩展编码;频率变换器,用于当输入信号的编码模式被确定为频域(FD)模式时,对输入信号执行频率变换;FD编码器,用于对变换的输入信号执行FD编码。
[0017] FD编码器可包括:标准化编码器,用于从每个频带的变换的输入信号提取能量,并且对提取的能量进行量化;阶乘脉冲编码器,用于对通过使用量化的标准化值缩放变换的输入信号而获得的值执行阶乘脉冲编码(FPC);额外噪声信息产生器,用于根据FPC的执行产生额外噪声信息,并且输入到FD编码器的变换的输入信号可以是瞬态
[0018] FD编码器可包括:标准化编码器,用于从每个频带的变换的输入信号提取能量,并且对提取的能量进行量化;阶乘脉冲编码器,用于对通过使用量化的标准化值缩放变换的输入信号而获得的值执行阶乘脉冲编码(FPC);额外噪声信息产生器,用于根据FPC的执行产生额外噪声信息;FD扩展编码器,用于对变换的输入信号的高频信号执行扩展编码,并且输入到FD编码器的变换的输入信号可以是静止帧。
[0019] FD扩展编码器可通过以不同的比特率使用相同的码本来执行能量量化。
[0020] 根据对变换的输入信号执行FD编码的结果的比特流包括先前帧模式信息。
[0021] 根据本发明的另一方面,提供一种编码设备,包括:信号分类单元,用于基于输入信号的特征来确定输入信号的编码模式;线性预测系数(LPC)编码器,用于从输入信号的低频信号提取LPC,并且对LPC进行量化;码激励线性预测(CELP)编码器,用于当输入信号的编码模式被确定为CELP编码模式时,对使用LPC提取的输入信号的低频信号的LPC激励信号执行CELP编码;时域(TD)扩展编码器,用于当对LPC激励信号执行CELP编码时,对输入信号的高频信号执行扩展编码;音频编码器,用于当输入信号的编码模式被确定为音频模式时,对LPC激励信号执行音频编码;FD扩展编码器,用于当对LPC激励信号执行音频编码时,对输入信号的高频信号执行扩展编码。
[0022] FD扩展编码器可通过以不同的比特率使用相同的码本来执行能量量化。
[0023] 根据本发明的另一方面,提供一种解码设备,包括:核心解码器,用于对包括在比特流中的核心编码的输入信号执行核心解码;上采样器,用于对核心解码的输入信号进行上采样;频率变换器,用于对上采样的输入信号执行频率变换;扩展编码器,用于通过使用包括在比特流中的输入信号的能量和频域中的输入信号来执行带宽扩展解码。
[0024] 扩展解码器可包括:反量化器,用于对输入信号的能量进行反量化;基信号产生器,用于通过使用频域中的输入信号产生基信号;增益计算器,用于通过使用反量化的能量和基信号的能量来计算将被应用于基信号的增益;增益应用单元,用于对每个频带应用所述增益。
[0025] 基信号产生器可包括:人工信号产生器,用于通过复制并折叠频域中的输入信号的低频频带来产生与高频频带相应的人工信号;包络估计器,用于通过使用包括在比特流中的窗口来估计基信号的包络;包络应用单元,用于对人工信号应用估计的包络。
[0026] 根据本发明的另一方面,提供一种解码设备,包括:模式信息检查单元,用于检查包括在比特流中的每一帧的模式信息;码激励线性预测(CELP)解码器,用于基于检查的结果对CELP编码的帧执行CELP解码;时域(TD)扩展解码器,用于通过使用执行CELP解码的结果和低频信号的激励信号中的至少一个来产生高频频带的解码的信号;频域(FD)解码器,用于基于检查的结果对FD编码的帧执行FD解码;频率反变换器,用于对执行FD解码的结果执行频率反变换。
[0027] FD解码器可包括:标准化解码器,用于基于包括在比特流中的标准化信息来执行标准化解码;阶乘脉冲编码(FPC)解码器,用于基于包括在比特流中的阶乘脉冲编码信息来执行FPC解码;噪声填充执行单元,用于对执行FPC解码的结果执行噪声填充。
[0028] FD解码器可包括:标准化解码器,用于基于包括在比特流中的标准化信息来执行标准化解码;阶乘脉冲编码(FPC)解码器,用于基于包括在比特流中的阶乘脉冲编码信息来执行FPC解码;噪声填充执行单元,用于对执行FPC解码的结果执行噪声填充;FD高频扩展解码器,用于基于执行FPC解码的结果和执行噪声填充的结果来执行高频扩展解码。
[0029] FD解码器可还包括:FD低频扩展解码器,用于当执行FPC解码的频带的上频带值小于核心信号的频带的上频带值时,对执行FPC解码和噪声填充的结果执行扩展解码。
[0030] FD高频扩展解码器可通过以不同的比特率共享相同的码本来执行能量的反量化。
[0031] FD解码器可基于包括在比特流中的先前帧模式信息来对FD编码的帧执行FD解码。
[0032] 根据本发明的另一方面,提供一种解码设备,包括:模式信息检查单元,用于检查包括在比特流中的每一帧的模式信息;线性预测系数(LPC)解码器,用于对包括在比特流中的帧执行LPC解码;码激励线性预测(CELP)解码器,用于基于检查的结果对CELP编码的帧执行CELP解码;时域(TD)扩展解码器,用于通过使用执行CELP解码的结果和低频信号的激励信号中的至少一个来产生高频频带的解码的信号;音频解码器,用于基于检查的结果对音频编码的帧执行音频解码;频域(FD)扩展解码器,用于通过使用执行音频解码的结果来执行扩展解码。
[0033] FD扩展解码器可通过以不同的比特率共享相同的码本来执行能量的反量化。
[0034] 根据本发明的另一方面,提供一种编码方法,包括:对输入信号进行下采样;对下采样的输入信号执行核心编码;对输入信号执行频率变换;通过使用频域中的输入信号的基信号来执行带宽扩展编码。
[0035] 根据本发明的另一方面,提供一种编码方法,包括:对输入信号进行下采样;对下采样的输入信号执行核心编码;对输入信号执行频率变换;通过使用频域中的输入信号和输入信号的基信号的特征来执行带宽扩展编码。
[0036] 根据本发明的另一方面,提供一种编码方法,包括:基于通过使用频域中的输入信号和时域中的输入信号来选择用于执行带宽扩展编码的编码模式;通过使用频域中的输入信号和所述编码模式来执行带宽扩展编码。
[0037] 根据本发明的另一方面,提供一种解码方法,包括:对包括在比特流中的核心编码的输入信号执行核心解码;对核心解码的输入信号进行上采样;对上采样的输入信号执行频率变换;通过使用频域中的输入信号和包括在比特流中的输入信号的能量来执行带宽扩展解码。
[0038] 根据本发明的另一方面,提供一种编码方法,包括:基于输入信号的特征来确定输入信号的编码模式;当输入信号的编码模式被确定为码激励线性预测(CELP)编码模式时,对输入信号的低频信号执行CELP编码;当对输入信号的低频信号执行CELP编码时,对输入信号的高频信号执行时域(TD)扩展编码;当输入信号的编码模式被确定为频域(FD)模式时,对输入信号执行频率变换;对变换的输入信号执行FD编码。
[0039] 执行FD编码的步骤可包括:通过以不同的比特率共享相同的码本来执行能量量化。
[0040] 根据对变换的输入信号执行FD编码的结果的比特流可包括先前帧模式信息。
[0041] 根据本发明的另一方面,提供一种编码方法,包括:基于输入信号的特征来确定输入信号的编码模式;从输入信号的低频信号提取线性预测系数(LPC)LPC,并且对LPC进行量化;当输入信号的编码模式被确定为CELP编码模式时,对使用LPC提取的输入信号的低频信号的LPC激励信号执行码激励线性预测(CELP)编码;当对LPC激励信号执行CELP编码时,对输入信号的高频信号执行时域(TD)扩展编码;当输入信号的编码模式被确定为音频编码模式时,对LPC激励信号执行音频编码;当对LPC激励信号执行音频编码时,对输入信号的高频信号执行频域(FD)扩展编码。
[0042] 执行FD扩展编码的步骤可包括:通过以不同的比特率共享相同的码本来执行能量量化。
[0043] 根据本发明的另一方面,提供一种解码方法,包括:检查包括在比特流中的每一帧的模式信息;基于检查的结果对CELP编码的帧执行码激励线性预测(CELP)解码;通过使用执行CELP解码的结果和低频信号的激励信号中的至少一个来产生高频频带的解码的信号;基于检查的结果对FD编码的帧执行频域(FD)解码;对执行FD解码的结果执行频率反变换。
[0044] 执行FD解码的步骤可包括:通过以不同的比特率共享相同的码本来执行能量的反量化。
[0045] 执行FD解码的步骤可包括:基于包括在比特流中的先前帧模式信息来对FD编码的帧执行FD解码。
[0046] 根据本发明的另一方面,提供一种解码方法,包括:检查包括在比特流中的每一帧的模式信息;对包括在比特流中的帧执行线性预测系数(LPC)解码;基于检查的结果对CELP编码的帧执行码激励线性预测(CELP)解码;通过使用执行CELP解码的结果和低频信号的激励信号中的至少一个来产生高频频带的解码的信号;基于检查的结果对音频编码的帧执行音频解码;通过使用执行音频解码的结果来执行频域(FD)扩展解码。
[0047] 执行FD扩展解码的步骤可包括:通过以不同的比特率使用相同的码本来执行能量反量化。
[0048] 有益效果
[0049] 根据本发明的实施例,通过提取输入信号的基信号,并且通过使用输入信号的高频频带的音调和基信号的音调来控制输入信号的能量,高频频带的带宽可被有效地扩展。附图说明
[0050] 图1是根据本发明的实施例的编码设备和解码设备的框图
[0051] 图2A是根据本发明的实施例的编码设备的整体结构的框图。
[0052] 图2B是根据本发明的另一实施例的编码设备的整体结构的框图。
[0053] 图2C是根据本发明的实施例的包括在编码设备中的频域(FD)编码器的框图。
[0054] 图2D是根据本发明的另一实施例的编码设备的整体结构的框图。
[0055] 图3是根据本发明的实施例的包括在编码设备中的核心编码器的框图。
[0056] 图4是根据本发明的实施例的包括在编码设备中的扩展编码器的框图。
[0057] 图5是根据本发明的另一实施例的包括在编码设备中的扩展编码器的框图。
[0058] 图6是根据本发明的实施例的包括在扩展编码器中的基信号产生器的框图。
[0059] 图7是根据本发明的实施例的包括在扩展编码器中的因子估计器的框图。
[0060] 图8是示出根据本发明的实施例的能量量化器的操作的流程图
[0061] 图9是示出根据本发明的实施例的对能量进行量化的处理的示图。
[0062] 图10是示出根据本发明的实施例的产生人工信号的处理的示图。
[0063] 图11A和图11B分别示出根据本发明的实施例的用于估计包络的窗口。
[0064] 图12A是根据本发明的实施例的解码设备的框图。
[0065] 图12B是根据本发明的另一实施例的解码设备的框图。
[0066] 图12C是根据本发明的实施例的包括在解码设备中的FD解码器的框图。
[0067] 图12D是根据本发明的另一实施例的解码设备的框图。
[0068] 图13是根据本发明的实施例的包括在解码设备中的扩展解码器的框图。
[0069] 图14是示出根据本发明的实施例的包括在扩展解码器中的反量化器的操作的流程图。
[0070] 图15A是示出根据本发明的实施例的编码方法的流程图。
[0071] 图15B是示出根据本发明的另一实施例的编码方法的流程图。
[0072] 图15C是示出根据本发明的另一实施例的编码方法的流程图。
[0073] 图16A是示出根据本发明的实施例的解码方法的流程图。
[0074] 图16B是示出根据本发明的另一实施例的解码方法的流程图。
[0075] 图16C是示出根据本发明的另一实施例的解码方法的流程图。
[0076] 图17是根据本发明的另一实施例的编码设备的整体结构的框图。
[0077] 图18是示出根据本发明的另一实施例的包括在编码设备中的能量量化器的操作的流程图。
[0078] 图19是示出根据本发明的实施例的通过使用非均匀比特分配(unequal bit allocation)方法来对能量进行量化的处理的示图。
[0079] 图20是示出根据本发明的实施例的使用帧内预测的矢量量化的示图。
[0080] 图21是示出根据本发明的另一实施例的通过使用频率加权方法来对能量进行量化的处理的示图。
[0081] 图22是示出根据本发明的实施例的使用多级划分矢量量化和帧内预测的矢量量化的示图。
[0082] 图23是示出根据本发明的另一实施例的包括在解码设备中的反量化器的操作的示图。
[0083] 图24是根据本发明的另一实施例的编码设备的整体结构的框图。
[0084] 图25是示出根据本发明的实施例的比特流的示图。
[0085] 图26是示出根据本发明的实施例的对每个频带执行频率分配的方法的示图。
[0086] 图27是示出根据本发明的实施例的在FD编码器或FD解码器中使用的频带的示图。

具体实施方式

[0087] 下面,将参照附图详细描述本发明的示例性实施例。
[0088] 图1是根据本发明的实施例的编码设备101和解码设备102的框图。
[0089] 编码设备101可产生输入信号的基信号(或基本信号),并且将基信号发送到解码设备102。基于输入信号的低频信号产生基信号。由于通过白化低频信号的包络信息来获得基信号,因此基信号可以是用于高频带宽扩展的激励信号。解码设备102可从基信号中重构输入信号。换句话说,编码设备101和解码设备102执行超宽带带宽扩展(SWB BWE)。详细地,通过SWB BWE,可基于与0到6.4KHz的低频频带相应的解码的宽带(WB)信号来产生与同SWB相应的6.4KHz到16KHz的高频频带相应的信号。这里,所述16KHz可根据环境而变化。可通过使用根据基于线性预测域(LPD)的码激励线性预测(CELP)的语音编解码器或通过在频域中执行量化来产生解码的WB信号。在频域中执行量化的方法的示例可包括基于修正离散余弦变换(MDCT)的高级音频编码(AAC)。
[0090] 现在将详细描述编码设备101和解码设备102的操作。
[0091] 图2是根据本发明的实施例的编码设备101的整体结构的框图。
[0092] 参照图2A,编码设备101可包括下采样器201、核心编码器202、频率变换器203和扩展编码器204。
[0093] 对于宽带(WB)编码,下采样器201可对输入信号进行下采样。一般而言,输入信号(例如,具有32KHz的采样率的超宽带(SWB)信号)被转换为具有合适于WB编码的采样率的信号。例如,下采样器201可将具有例如32KHz的采样率的输入信号下采样为具有例如12.8KHz的采样率的信号。
[0094] 核心编码器202可对下采样的输入信号执行核心编码。换句话说,核心编码器202可执行WB编码。例如,核心编码器202可基于CELP方法来执行WB编码。
[0095] 频率变换器203可对输入信号执行频率变换。例如,频率变换器203可执行快速傅里叶变换(FFT)或MDCT来对输入信号执行频率变换。下面假设使用MDCT。
[0096] 扩展编码器204可通过使用频域中的输入信号的基信号来执行带宽扩展编码。也就是说,扩展编码器204可基于频域中的输入信号来执行SWB BWE编码。在这种情况下,如下面将参照图4所描述的,扩展编码器204不接收编码信息。
[0097] 另外,扩展编码器204可基于频域中的输入信号和输入信号的基信号的特征来执行带宽扩展编码。在这种情况下,可根据输入信号的特征的源如图4或图5中所示来实现扩展编码器204。
[0098] 下面将参照图4和图5详细描述扩展编码器204的操作。
[0099] 因此,图2A的上部路径和下部路径分别表示核心编码处理和带宽扩展编码处理。可通过SWB BWE编码将输入信号的能量信息发送到解码设备102。
[0100] 图2B是根据本发明的另一实施例的编码设备101的整体结构的框图。
[0101] 参照图2B,编码设备101可包括信号分类单元205、CELP编码器206、时域(TD)扩展编码器207、频率变换器208和频域(FD)编码器209。
[0102] 信号分类单元205基于输入信号的特征来确定输入信号的编码模式。在当前实施例中,编码模式可以是编码方法。
[0103] 例如,信号分类单元205可考虑输入信号的时域特征和频域特征来确定输入信号的编码模式。另外,当输入信号的特征是语音信号时,信号分类单元205确定将对输入信号执行CELP编码,当输入信号的特征是音频信号时,信号分类单元205确定将对输入信号执行FD编码。
[0104] 然而,提供给信号分类单元205的输入信号可以是由下采样器(未示出)下采样的信号。例如,根据当前实施例,输入信号可以是通过对具有32kHz或48kHz的采样率的信号进行重新采样而具有12.8kHz或16kHz的采样率的信号。所述重新采样可以是下采样。
[0105] 如上面参照图2A所描述的,具有32kHz的采样率的信号可以是超宽带(SWB)信号。SWB信号可以是全频带(FB)信号。具有16kHz的采样率的信号可以是WB信号。
[0106] 信号分类单元205可基于低频信号的特征,确定与输入信号的低频频带相应的低频信号的编码模式是CELP模式或FD模式。
[0107] 如果输入信号的编码模式是被确定为CELP模式,则CELP编码器206对输入信号的低频信号执行CELP编码。例如,CELP编码器206可从输入信号的低频信号提取激励信号,并且基于与基频信息(pitch information)相应的固定码本贡献(fixed  codebook contribution)和自适应码本贡献(adaptive codebook contribution)来对提取的激励信号进行量化。
[0108] 然而,本发明并不限于此,CELP编码器206可还从输入信号的低频信号提取线性预测系数(LPC),对提取的LPC进行量化,并通过使用量化的LPC来提取激励信号。
[0109] 另外,根据当前实施例,CELP编码器206可根据依据输入信号的低频信号的特征的各种编码模式对输入信号的低频信号执行CELP编码。例如,CELP编码器206可根据例如有声编码模式(voiced coding mode)、无声编码模式(unvoiced coding mode)、瞬态编码模式(transition coding mode)和一般编码模式(generic coding mode)中的一个模式对输入信号的低频信号执行CELP编码。
[0110] 当对输入信号的低频信号执行CELP编码时,TD扩展编码器207对输入信号的高频信号执行扩展编码。例如,TD扩展编码器207对与输入信号的高频频带相应的高频信号的LPC进行量化。在这种情况下,TD扩展编码器207可提取输入信号的高频信号的LPC,并且对提取的LPC进行量化。否则,TD扩展编码器207可通过使用输入信号的低频信号的激励信号来产生输入信号的高频信号的LPC。
[0111] 因此,TD扩展编码器207可以是TD高频扩展编码器,但是本发明不限于此。
[0112] 如果输入信号的编码模式被确定为FD编码模式,则频率变换器208对输入信号执行频率变换。例如,频率变换器208可对输入信号执行包括重叠帧的频率变换(例如,MDCT),但是本发明不限于此。
[0113] FD编码器209对频率变换的输入信号执行FD编码。例如,FD编码器209可对由频率变换器208变换的频谱执行FD编码。下面将参照图2C详细描述FD编码器209。
[0114] 根据当前实施例,如上所述,编码设备101可通过对输入信号进行编码来输出比特流。例如,比特流可包括报头和有效载荷
[0115] 报头可包括指示用于对输入信号进行编码的编码模式的编码模式信息。有效载荷可包括根据用于对输入信号进行编码的编码模式的信息。如果根据CELP模式对输入信号进行编码,则有效载荷可包括CELP信息和TD高频扩展信息。如果根据FD模式对输入信号进行编码,则有效载荷可包括预测数据和FD信息。
[0116] 然而,在根据当前实施例的比特流中,报头可还包括用于修复可能发生的帧差错的先前帧模式信息。例如,如果输入信号的编码模式被确定为FD模式,则如下面将参照图25所详细描述的,报头可还包括先前帧模式信息。
[0117] 因此,根据输入信号的特征将根据当前实施例的编码设备101切换至使用CELP模式或FD模式,从而根据输入信号的特征对输入信号进行适当地编码。另外,编码设备101根据信号分类单元205的确定来使用FD模式,从而在高比特率环境中适当地执行编码。
[0118] 图2C是根据本发明的实施例的FD编码器209的框图。
[0119] 参照图2C,FD编码器209可包括标准化编码器2091、阶乘脉冲编码器2092、额外噪声信息产生器2093和FD扩展编码器2094。
[0120] 标准化编码器2091从由频率变换器208变换的输入信号的每个频带提取能量,并且对提取的能量进行量化。另外,标准化编码器2091可基于提取的能量执行缩放。在这种情况下,缩放的能量值可被量化。例如,可通过使用用于测量能量的测量方法或者与频带的能量具有比例关系的功率来获得根据当前实施例的能量值。
[0121] 作为标准化编码器2091执行的量化的结果的标准化信息可被包括在比特流中,并可与比特流一起被发送到解码设备102。
[0122] 例如,标准化编码器2091将与输入信号相应的频谱划分为预定数量的频带,从每个频带的频谱提取能量,并且对提取的能量进行量化。量化值可用于使频谱标准化。
[0123] 标准化编码器2091可还对量化值进行编码。
[0124] 阶乘脉冲编码器2092可对通过使用量化的标准化值缩放变换的输入信号而获得的值执行阶乘脉冲编码(FPC)。换句话说,阶乘脉冲编码器2092可对通过标准化编码器2091标准化的频谱值执行FPC。
[0125] 例如,阶乘脉冲编码器2092分配可用于每个频带的比特的数量,并且根据分配的比特的数量对标准化的频谱值执行FPC。在这种情况下,可根据目标比特率来确定分配到每个频带的比特的数量。另外,阶乘脉冲编码器2092可通过使用由标准化编码器2091量化的标准化编码值来计算将被分配到每个频带的比特的数量。在这种情况下,阶乘脉冲编码器2092可对频率变换的频谱而不是标准化的频谱执行FPC。
[0126] 额外噪声信息产生器2093根据FPC的执行来产生额外噪声信息。例如,额外噪声信息产生器2093基于由阶乘脉冲编码器2092对频谱执行FPC的结果来产生适当的噪声电平。
[0127] 在这种情况下,由额外噪声信息产生器2093产生的额外噪声信息可被包括在比特流中,使得解码侧可参照额外噪声信息来执行噪声填充。
[0128] FD扩展编码器2094对输入信号的高频信号执行扩展编码。更具体地,FD扩展编码器2094通过使用低频频谱执行高频扩展。
[0129] 例如,FD扩展编码器2094对与输入信号的高频频带相应的高频信号的频域能量信息进行量化。在这种情况下,FD扩展编码器2094可将与输入信号相应的频谱划分为预定数量的频带,从每个频带的频谱获得能量值,并且通过使用所述能量值执行多级矢量量化(MSVQ)。MSVQ可以是多级矢量量化。
[0130] 更具体地,FD扩展编码器2094可通过从所述预定数量的频带中收集奇数频带的能量信息来执行矢量量化(VQ),基于根据矢量量化的结果的量化值来获得偶数频带中的预测误差,并且在下一级对获得的预测误差执行矢量量化。
[0131] 然而,本发明不限于此,FD扩展编码器2094可通过从所述预定数量的频带中收集偶数频带的能量信息来执行矢量量化,并且通过使用根据矢量量化的结果的量化值来获得奇数频带中的预测误差。
[0132] 也就是说,FD扩展编码器2094从通过对第n频带执行矢量量化而获得的量化值和通过对第(n+2)频带执行矢量量化而获得的量化值获得第(n+1)频带中的预测误差。这里,“n”表示自然数。
[0133] 另外,为了通过收集能量信息来执行矢量量化,FD扩展编码器2094可模拟在预定频带中产生激励信号的方法,并且可在根据模拟的结果的激励信号的特征与所述预定频带中的原始信号的特征不同时控制能量。在这种情况下,根据模拟的结果的激励信号的特征和原始信号的特征可包括音调和噪度因子中的至少一个,但是本发明不限于此。因此,当解码侧对实际能量进行解码时,可防止噪声增加。
[0134] FD扩展编码器2094可使用多模式带宽扩展,其中,所述多模式带宽扩展使用根据输入信号的高频信号的特征产生激励信号的各种方法。例如,FD扩展编码器2094可根据输入信号的特征对每一帧使用标准模式、谐波模式和噪声模式中的一个模式来产生激励信号。
[0135] 另外,根据当前实施例,FD扩展编码器2094可产生根据比特率变化的频带的信号。也就是说,与FD扩展编码器2094对其执行扩展编码的高频信号相应的高频频带可根据比特率而不同地设置。
[0136] 例如,FD扩展编码器2094可被用于以16kbps的比特率产生与约6.4kHz到14.4kHz的频带相应的信号,并且以等于或大于16kbps的比特率产生与约8kHz到16kHz的频带相应的信号。另外,FD扩展编码器2094以16kbps的比特率对与约6.4kHz到14.4kHz的频带相应的高频信号执行扩展编码,并以等于或大于16kbps的比特率对与约8kHz到16kHz的频带相应的高频信号执行扩展编码。
[0137] 在这种情况下,根据当前实施例,如下面将参照图26所详细描述的,FD扩展编码器2094可通过以不同的比特率共享相同的码本来执行能量量化。
[0138] 如果静止帧被输入到FD编码器209,则FD编码器209的标准化编码器2091、阶乘脉冲编码器2092、额外噪声信息产生器2093和FD扩展编码器2094可进行操作。
[0139] 然而,当瞬态帧被输入时,FD扩展编码器2094可不操作。在这种情况下,与当静止帧被输入时相比,标准化编码器2091和阶乘脉冲编码器2092可设置被执行FPC的频带的更高上频带值Fcore。下面将参照图27详细描述上频带值Fcore。
[0140] 图2D是根据本发明的另一实施例的编码设备101的整体结构的框图。
[0141] 参照图2D,编码设备101可包括信号分类单元210、LPC编码器211、CELP编码器212、TD扩展编码器213、音频编码器214和FD扩展编码器215。
[0142] 信号分类单元210根据输入信号的特征确定输入信号的编码模式。根据当前实施例,编码模式可以是编码方法。
[0143] 例如,信号分类单元210基于输入信号的时域特征和频域特征来确定输入信号的编码模式。另外,当输入信号的特征是语音信号时,信号分类单元205可确定将对输入信号执行CELP编码,当输入信号的特征是音频信号时,信号分类单元205确定将对输入信号执行音频编码。
[0144] LPC编码器211从输入信号的低频信号提取LPC,并且对LPC进行量化。例如,根据当前实施例,LPC编码器211可使用例如,网格编码量化(TCQ)、MSVQ或点阵矢量量化(LVQ)来对LPC进行量化,但本发明不限于此。
[0145] 更具体地,LPC编码器211可对例如具有32kHz或48kHz的采样率的输入信号进行重新采样来从具有12.8kHz或16kHz的采样率的输入信号的低频信号提取LPC。
[0146] 如上面参照图2A和图2B所描述的,具有32kHz的采样率的信号可以是SWB信号。SWB信号可以是FB信号。另外,具有16kHz的采样率的信号可以是WB信号。
[0147] LPC编码器211可还通过使用量化的LPC来提取LPC激励信号,但是本发明不限于此。
[0148] 如果输入信号的编码模式被确定为CELP模式,则CELP编码器212对使用LPC提取的LPC激励信号执行CELP编码。例如,CELP编码器212可基于与基频信息相应的固定码本贡献和自适应码本贡献来对LPC激励信号进行量化。在这种情况下,可通过CELP编码器212和LPC编码器211中的至少一个来产生LPC激励信号。
[0149] 根据当前实施例,CELP编码器212可还根据依据输入信号的低频信号的特征的各种编码模式来执行CELP编码。例如,CELP编码器206可通过使用有声编码模式、无声编码模式、瞬态编码模式或一般编码模式中的一个模式对输入信号的低频信号执行CELP编码。
[0150] 当对输入信号的低频信号的LPC激励信号执行CELP编码时,TD扩展编码器213对输入信号的高频信号执行扩展编码。
[0151] 例如,TD扩展编码器213对输入信号的高频信号的LPC进行量化。在这种情况下,TD扩展编码器213可通过使用输入信号的低频信号的LPC激励信号来提取输入信号的高频信号的LPC。
[0152] 因此,TD扩展编码器213可以是TD高频扩展编码器,但是本发明不限于此。
[0153] 如果输入信号的编码模式被确定为音频编码模式,则音频编码器214对使用LPC提取的LPC激励信号执行音频编码。
[0154] 例如,音频编码器214可对LPC激励信号执行频率变换,并对变换的LPC激励信号进行量化。
[0155] 这里,当音频编码器214执行频率变换时,音频编码器214可使用不包括重叠帧的频率变换方法(例如,离散余弦变换(DCT))。另外,音频编码器214可根据FPC或点阵VQ(LVQ)对频率变换的激励信号频谱执行量化。
[0156] 另外,如果音频编码器214具有多余的比特来对LPC激励信号执行量化,则音频编码器214可进一步基于固定码本贡献和自适应码本贡献的TD编码信息进行量化。
[0157] 当对输入信号的低频信号的LPC激励信号执行音频编码时,FD扩展编码器215对输入信号的高频信号执行扩展编码。换句话说,FD扩展编码器215可通过使用低频频谱来执行高频扩展。
[0158] 例如,FD扩展编码器215对与输入信号的高频频带相应的高频信号的频域能量信息执行量化。在这种情况下,FD扩展编码器215可通过使用频率变换方法(例如,MDCT)来产生频谱,将频谱划分为预定数量的频带,获得每个频带的频谱的能量,并且通过使用所述能量执行MSVQ。这里,MSVQ可以是多级矢量量化。
[0159] 更具体地,FD扩展编码器215可通过从所述预定数量的频带中收集奇数频带的能量信息来执行矢量量化,基于根据矢量量化的结果的量化值来获得偶数频带中的预测误差,并且在下一级对预测误差执行矢量量化。
[0160] 然而,本发明不限于此,FD扩展编码器215可通过从所述预定数量的频带中收集偶数频带的能量信息来执行矢量量化,并且通过使用根据矢量量化的结果的量化值来获得奇数频带中的预测误差。
[0161] 也就是说,FD扩展编码器215通过使用通过对第n频带执行矢量量化而获得的量化值和通过对第(n+2)频带执行矢量量化而获得的量化值来获得第(n+1)频带中的预测误差。这里,“n”表示自然数。
[0162] 另外,为了通过收集能量信息来执行矢量量化,FD扩展编码器215可模拟在预定频带中产生激励信号的方法,并且可在根据模拟的结果的激励信号的特征与所述预定频带中的原始信号的特征不同时控制能量。在这种情况下,根据模拟的结果的激励信号的特征和原始信号的特征可包括音调和噪度因子中的至少一个,但是本发明不限于此。因此,当解码侧对实际能量进行解码时,可防止噪声增加。
[0163] FD扩展编码器215可使用多模式带宽扩展,其中,所述多模式带宽扩展使用根据输入信号的高频信号的特征来产生激励信号的各种方法。例如,FD扩展编码器215可根据输入信号的特征通过对每一帧使用标准模式、谐波模式、瞬态模式或噪声模式来产生激励信号。在瞬态模式中,时域包络信息也可被量化。
[0164] 另外,根据当前实施例,FD扩展编码器215可产生根据比特率变化的频带的信号。换句话说,与FD扩展编码器215对其执行扩展编码的高频信号相应的高频频带可根据比特率被不同地设置。
[0165] 例如,FD扩展编码器215可被用于以16kbps的比特率产生与约6.4kHz到14.4kHz的频带相应的信号,并且以等于或大于16kbps的比特率产生与约8kHz到16kHz的频带相应的信号。另外,FD扩展编码器215以16kbps的比特率对与约6.4kHz到14.4kHz的频带相应的高频信号执行扩展编码,并且以等于或大于16kbps的比特率对与约8kHz到16kHz的频带相应的高频信号执行扩展编码。
[0166] 在这种情况下,根据当前实施例,如下面将参照图26所详细描述的,FD扩展编码器215可通过以不同的比特率共享相同的码本来执行能量量化。
[0167] 在当前实施例中,编码设备101可如上所述对输入信号进行编码,并且以编码的比特流的形式输出。例如,比特流可包括报头和有效载荷。
[0168] 在这种情况下,报头可包括指示用于对输入信号进行编码的编码模式的编码模式信息。当通过使用CELP模式对输入信号进行编码时,有效载荷可包括CELP信息和TD高频扩展信息,并且当通过使用音频编码模式对输入信号进行编码时,有效载荷可包括预测数据、音频编码信息和FD高频扩展信息。
[0169] 编码设备101可根据输入信号的特征被切换到使用CELP模式或音频编码模式。因此,可根据输入信号的特征执行适当的编码模式。另外,编码设备101可根据信号分类单元210的确定来使用FD模式,从而在低比特率环境下适当地执行编码。
[0170] 图3是根据本发明的实施例的编码设备101的核心编码器202的框图。
[0171] 参照图3,核心编码器202可包括信号分类单元301和编码器302。
[0172] 信号分类单元301可对下采样的输入信号的特征进行分类,例如,12.8KHz。换句话说,信号分类单元301可根据输入信号的特征将输入信号的编码模式分类为各种编码模式。例如,根据ITU-T G.718编解码器,信号分类单元301可将语音信号的编码模式分类为有声编码模式、无声编码模式、瞬态编码模式和一般编码模式。无声编码模式被设计用于对无声帧和最不活跃帧进行编码。
[0173] 编码器302可执行针对由信号分类单元301分类的输入信号的特征而优化的编码。
[0174] 图4是根据本发明的实施例的编码设备101的扩展编码器204的框图。
[0175] 参照图4,扩展编码器204可包括基信号产生器401、因子估计器402、能量提取器403、能量控制器404和能量量化器405。例如,扩展编码器204可在不接收关于编码模式的信息的情况下估计能量控制因子。作为另一示例,扩展编码器204可通过使用编码模式来估计能量控制因子。可从核心编码器202接收关于编码模式的信息。
[0176] 基信号产生器401可通过使用频域中的输入信号的频谱来产生输入信号的基信号。基信号指示用于基于WB信号执行SWB BWE的信号。换句话说,基信号指示构成低频频带的精细结构的信号。下面将参照图6详细描述产生基信号的处理。
[0177] 例如,因子估计器402可通过使用基信号来估计能量控制因子。也就是说,编码设备101发送输入信号的能量信息来在解码设备102中产生SWB区域的信号。在这种情况下,因子估计器402可从感知度估计能量控制因子,其中,所述能量控制因子是用于控制能量信息的参数。下面将参照图7详细描述估计能量控制因子的处理。
[0178] 作为另一示例,因子估计器402可通过使用基信号和输入信号的特征来估计能量控制因子。在这种情况下,可从核心编码器202接收输入信号的特征。
[0179] 能量提取器403可从频带中的输入信号提取能量。提取的能量被发送到解码设备102。可在每个频带中提取能量。
[0180] 能量控制器404可通过使用能量控制因子控制从输入信号提取的能量。换句话说,能量控制器404可通过对在每个频带中提取的能量应用能量控制因子来控制能量。
[0181] 能量量化器405可对控制的能量进行量化。能量可被转换为dB尺度,并随后被量化。具体地,能量量化器405可计算作为全部能量的整体能量,并且对整体能量以及整体能量和在每个频带中提取的能量之间的差进行标量量化。否则,从第一频带提取的能量被直接量化,随后在除了第一频带以外的每个频带中提取的能量和在先前频带中提取的能量之间的差可被量化。否则,能量量化器405可在不使用在频带中提取的能量之间的差的情况下,对在每个频带中提取的能量直接进行量化。当在每个频带中提取的能量被直接量化时,可使用标量量化或矢量量化。下面将参照图8和图9详细描述能量量化器405。
[0182] 图5是根据本发明的另一实施例的编码设备101的扩展编码器204的框图。
[0183] 参照图5,与图4的扩展编码器204相比,扩展编码器204可还包括信号分类单元501。例如,因子估计器402可通过使用基信号和输入信号的特征来估计能量控制因子。在这种情况下,可从信号分类单元501而不是从核心编码器202接收输入信号的特征。
[0184] 信号分类单元501可根据输入信号的特征对输入信号进行分类(例如,32KHz和MDCT频谱)。详细地,信号分类单元501可基于输入信号的特征将输入信号的编码模式分类为各种编码模式。
[0185] 通过根据输入信号的特征对输入信号进行分类,可仅从适合于执行能量控制因子估计处理的信号估计能量控制因子,并且能量控制因子可控制能量。例如,可能不适合对不包含音调分量的信号(例如,噪声信号或无声信号)执行能量控制因子估计处理。在这种情况下,如果输入信号的编码模式被分类为无声编码模式,则扩展编码器204可在不执行能量控制因子估计的情况下执行带宽扩展编码。
[0186] 图5中示出的基信号产生器401、因子估计器402、能量提取器403、能量控制器404和能量量化器405如上面参照图4被描述。
[0187] 图6是根据本发明的实施例的包括在扩展编码器204中的基信号产生器401的框图。
[0188] 参照图6,基信号产生器401可包括人工信号产生器601、包络估计器602和包络应用单元603。
[0189] 人工信号产生器601可通过复制和折叠频带中的输入信号的低频频带来产生与高频频带相应的人工信号。换句话说,人工信号产生器601可通过复制频域中的输入信号的低频频谱来产生SWB域区域中的人工信号。下面将参照图6详细描述产生人工信号的处理。
[0190] 包络估计器602可通过使用窗口来估计基信号的包络。基信号的包络可被用于消除关于在SWB区域中的人工信号的频谱中包括的低频频带的包络信息。可通过使用特定频率之前和之后的频谱来确定所述特定频率索引的包络。还可通过移动平均值估计基信号的包络。例如,如果MDCT被用于频率变换,则可通过MDCT变换的频谱的绝对值来估计基信号的包络。
[0191] 在这种情况下,包络估计器602可形成白化频带(whitening band),计算在每个白化频带中的频率幅度的平均值,并且将白化频带的频率幅度的平均值估计为属于所述白化频带的频率的包络。属于白化频带的频谱的数量可被设置为小于从中提取了能量的频带的数量。
[0192] 如果在每个白化频带中计算的频率幅度的平均值被估计为属于所述白化频带的频率的包络,则包络估计器602可发送指示属于白化频带的频谱的数量是大还是小的信息,从而控制基信号的平坦的程度。例如,包络估计器602可根据频谱的数量是八或三的两种类型来发送这样的信息。如果频谱的数量是三,则基信号的平坦的程度可比频谱的数量是八时更高。
[0193] 否则,包络估计器602可不发送指示属于白化频带的频谱的数量是大还是小的信息,并且可根据核心编码器202采用的编码模式来确定基信号的平坦的程度。核心编码器202可基于输入信号的特征将输入信号的编码模式分类为有声编码模式、无声编码模式、瞬态编码模式或一般编码模式,并可对输入信号进行编码。
[0194] 在这种情况下,包络估计器602可基于根据输入信号的特征的编码模式来控制属于白化频带的频谱的数量。例如,如果根据有声编码模式对输入信号进行编码,则包络估计器602可通过在白化频带形成三个频谱来估计基信号的包络。如果根据除了有声编码模式以外的编码模式对输入信号进行编码,则包络估计器602可通过在白化频带形成三个频谱来估计基信号的包络。
[0195] 包络应用单元603可对人工信号应用估计的包络。这样的处理与白化处理相应。可通过包络使人工信号平坦。包络应用单元603可通过根据频率索引中的每一个的包络划分人工信号来产生基信号。
[0196] 图7是根据本发明的实施例的包括在扩展编码器204中的因子估计器402的框图。
[0197] 参照图7,因子估计器402可包括第一音调计算器701、第二音调计算器702和因子计算器703。
[0198] 第一音调计算器701可计算频域中的输入信号的高频频带的音调。换句话说,第一音调计算器701可计算作为频域中的输入信号的高频频带的SWB区域的音调。
[0199] 第二音调计算器702可计算基信号的音调。
[0200] 可通过测量频谱平坦度来计算音调。详细地,可通过使用下面的等式(1)计算音调。可使用频谱的几何均值和算术均值之间的关系来测量频谱平坦度。
[0201]
[0202] T:音调,S(k):频谱
[0203] N:频谱系数的长度,r:常数
[0204] 因子计算器703可通过使用输入信号的高频频带的音调和基信号的音调来计算能量控制因子。在这种情况下,可通过下面的等式计算能量控制因子:
[0205]
[0206] To:原始频谱的音调,Tb:基频谱的音调
[0207] No:原始频谱的噪声因子,Nb:基频谱的噪声因子
[0208] 其中“α”表示能量控制因子,“To”表示输入信号的音调,“Tb”表示基信号的音调。此外,“Nb”表示指示信号中包含噪声分量的程度的噪度因子。
[0209] 可通过下面的等式计算能量控制因子:
[0210]
[0211] 因子计算器703可计算用于每个频带的能量控制因子。计算的能量控制因子可被应用于输入信号的能量。在这种情况下,当能量控制因子小于预定阈值能量控制因子时,能量控制因子可被应用于输入信号的能量。
[0212] 图8是示出根据本发明的实施例的能量量化器405的操作的流程图。
[0213] 在操作S801,能量量化器405可通过使用能量控制因子来预处理能量矢量,并且选择预处理的能量矢量的子矢量。例如,能量量化器405可从每个能量矢量减去能量矢量的平均值,或计算关于每个能量矢量的重要性的权重。在这种情况下,可按照合成声音的质量可被最大化的方式来计算权重。
[0214] 另外,能量量化器405可基于编码效率适当选择能量矢量的子矢量。另外,能量量化器405可以以相同的时间间隔选择子矢量来提高插值效率。
[0215] 例如,能量量化器405可根据下面的等式(4)来选择子矢量。
[0216] k×n(n=0,…,N),k≥2,N表示小于矢量维度的最大整数…(4)
[0217] 在这种情况下,如果k=2,则仅选择偶数。
[0218] 在操作S802,能量量化器405对选择的子矢量进行量化和反量化。能量量化器405可通过选择用于最小化通过使用下面的等式(5)计算的均方误差(MSE)的量化索引来对子矢量进行量化。
[0219]
[0220] 能量量化器405可通过使用标量量化、矢量量化、TCQ或LVQ来对子矢量进行量化。在矢量量化中,可执行MSVQ或划分VQ,或者可同时执行划分VQ和多级VQ。量化索引被发送到解码设备102。
[0221] 当在预处理期间计算了权重时,能量量化器405可通过使用加权的MSE(WMSE)来计算优化的量化索引。在这种情况下,可通过以下等式计算WMSE:
[0222]
[0223] 在操作S803,能量量化器405可对未被选择的其余子矢量进行插值。
[0224] 在操作S804,能量量化器405可计算插值误差,其中,所述插值误差是插值的其余子矢量和与能量矢量匹配的原始子矢量之间的差。
[0225] 在操作S805,能量量化器405对插值误差进行量化和反量化。在这种情况下,能量量化器405可通过使用用于最小化MSE的量化索引来对插值误差进行量化。能量量化器405可通过使用标量量化、矢量量化、TCQ或LVQ来对插值误差进行量化。在这种情况下,在矢量量化中,可执行MSVQ或划分VQ,或者可同时执行划分VQ和MSVQ。如果在预处理期间计算了权重,则能量量化器405可通过使用WMSE来计算优化的量化索引。
[0226] 在操作S806,能量量化器405可通过对被选择的量化的子矢量进行插值来计算未被选择的其余子矢量,并且通过添加在操作S805计算的量化的插值误差来计算量化的能量值。并且,能量量化器405可在预处理期间通过重新添加平均值来计算最终量化的能量,其中,所述平均值在预处理期间被减去。
[0227] 在MSVQ中,能量量化器405通过使用K个子矢量候选执行量化来提高基于相同码本的量化的性能。如果“K”等于或大于“2”,则能量量化器405可通过执行失真测量来确定最优子矢量候选。在这种情况下,可根据下面两个方法中的一个来确定失真测量。
[0228] 第一,能量量化器405可产生索引集来最小化每一级中的每个子矢量候选的MSE或WMSE,并且从子矢量候选中选择在所有级中具有MSE或WMSE的最小和的子矢量候选。在这种情况下,计算的量很小。
[0229] 第二,能量量化器405可产生索引集来最小化每一级中的每个子矢量候选的MSE或WMSE,通过反量化重构能量矢量,选择子矢量候选来最小化重构能量矢量和原始能量矢量之间的MSE或WMSE。在这种情况下,由于能量矢量的重构,计算量增加,但是由于使用实际量化值计算MSE,因此性能更好。
[0230] 图9是示出根据本发明的实施例的对能量进行量化的处理的示图。
[0231] 参照图9,能量矢量表示14个维度。在第一级,能量量化器405通过选择能量矢量的偶数子矢量来选择与维度7相应的子矢量。在第一级,能量量化器405使用划分为二的第二级矢量量化来提高性能。
[0232] 能量量化器405在第二级通过使用第一级的误差信号来执行量化。能量量化器405通过对选择的子矢量进行反量化来计算插值误差,并且通过划分为二的第三级矢量量化来对插值误差进行量化。
[0233] 图10是示出根据本发明的实施例的产生人工信号的处理的示图。
[0234] 参照图10,人工信号产生器601可从整个频带的fL到6.4KHz复制与低频频带相应的频谱1001。复制的频谱1001被转移到从6.4到12.8-fL KHz的频带。可通过折叠与从6.4到12.8-fL KHz的频带相应的频谱来产生与从
[0235] 12.8-fL到16KHz的频带相应的频谱。换句话说,从6.4KHz到16KHz产生与作为高频频带的SWB区域相应的人工信号。
[0236] 如果执行MDCT来产生频谱,则在fL和6.4kHz之间存在相关性。详细地,当与6.4kHz相应的MDCT频率索引是偶数时,fL的频率索引也是偶数。相反,如果与6.4kHz相应的MDCT频率索引是奇数,则fL的频率索引也是奇数。
[0237] 例如,当MDCT被应用来从原始输入信号提取640个频谱时,与6.4kHz相应的索引是第256(即,6400/16000*640)个索引,这是偶数。在这种情况下,fL也被选为偶数。换句话说,2(50Hz)or 4(100Hz)可被用于fL。在解码处理期间也可使用这个处理。
[0238] 图11A和图11B分别示出根据本发明的实施例的用于估计包络的窗口1101和1102。
[0239] 参照图11A和图11B,在窗口1101和1102中的每一个上的峰值点表示用于估计当前包络的频率索引。可通过以下等式估计基信号的当前包络:
[0240]
[0241] Env(n):包络,w(k):窗口,S(k):频谱,n:频率索引,
[0242] 2d+1:窗口长度
[0243] 参照图11A和图11B,窗口1101和1102可被固定地使用,并且在这种情况下,不需要发送额外比特。如果窗口1101或1102被选择性地使用,则指示窗口1101或1102是否被用于估计包络的信息需要用比特表示,并且被额外地发送到解码设备102。比特可针对每个频带被发送或在一帧中被一次发送。
[0244] 与当使用窗口1101时相比,当使用窗口1102时,权重被进一步添加到与当前频率索引相应的频谱来估计包络。因此,使用窗口1102产生的基信号比使用窗口1101产生的基信号更平坦。可通过将由窗口1101和窗口1102产生的基信号中的每一个与输入信号的频谱进行比较来从窗口1101和窗口1102中选择窗口的类型。否则,可通过高频频带的音调的比较来从窗口1101和窗口1102中选择具有更接近高频频带的音调的音调的窗口。否则,可通过相关性的比较来从窗口1101和1102中选择与高频频带具有更高相关性的窗口。
[0245] 图12A是根据本发明的实施例的解码设备102的框图。
[0246] 由图12A的解码设备102执行的解码处理是由图2A的编码设备101执行的处理的逆处理。参照图12A,解码设备102可包括:核心解码器1201、上采样器1202、频率变换器1203、扩展解码器1204和频率反变换器1205。
[0247] 核心解码器2101可对包含在比特流中的核心编码的输入信号执行核心解码。通过核心解码,可提取具有12.8KHz的采样率的信号。
[0248] 上采样器1202可对核心解码的输入信号进行上采样。通过上采样,可提取具有32KHz的采样率的信号。
[0249] 频率变换器1203可对上采样的输入信号执行频率变换。在这种情况下,可使用在编码设备101中使用的相同频率变换。例如,可使用MDCT。
[0250] 扩展解码器1204可通过使用频带中的输入信号和包含在比特流中的输入信号的能量来执行带宽扩展解码。下面将参照图9详细描述扩展解码器1204的操作。
[0251] 频率反变换器1205可对执行带宽扩展解码的结果执行频率反变换。换句话说,频率反变换可以是由频率变换器1203执行的频率变换的逆操作。例如,频率反变换可以是修正离散余弦反变换(IMDCT)。
[0252] 图12B是根据本发明的另一实施例的解码设备102的框图。
[0253] 由图12B的解码设备102执行的解码处理是图12A的处理的逆处理。参照图12B,解码设备102可包括模式信息检查单元1206、CELP解码器1207、TD扩展解码器120、FD解码器1209和频率反变换器1210。
[0254] 模式信息检查单元1206检查包括在比特流中的每一帧的模式信息。比特流可以是发送到解码设备102的与根据由编码设备101执行的编码的结果的比特流相应的信号。
[0255] 例如,模式信息检查单元1206从比特流解析模式信息,并且根据依据解析的结果的当前帧的编码模式,执行到CELP解码模式或FD解码模式中的一个的切换操作。
[0256] 更具体地,模式信息检查单元1206可针对包括在比特流中的每一帧,按照根据CELP模式编码的帧可被CELP解码,根据FD模式编码的帧可被FD解码的方式进行切换。
[0257] CELP解码器1207基于检查的结果对根据CELP模式编码的帧执行CELP解码。例如,CELP解码器1207对包括在比特流中的LPC进行解码,对自适应码本贡献和固定码本贡献进行解码,组合解码的结果,并产生与低频频带的解码的信号相应的低频信号。
[0258] TD扩展解码器1208通过使用执行CELP解码的结果和低频信号的激励信号中的至少一个来产生高频频带的解码的信号。在这种情况下,低频信号的激励信号可被包括在比特流中。另外,TD扩展解码器1208可使用包括在比特流中的关于高频信号的LPC信息来产生与高频频带的解码的信号相应的高频信号。
[0259] 另外,根据当前实施例,TD扩展解码器1208可通过将高频信号和CELP解码器1207产生的低频信号进行组合来产生解码的信号。为了产生解码的信号,TD扩展解码器1208可还将低频信号和高频信号的采样率转换为相同。
[0260] FD解码器1209对FD编码的帧执行FD解码。FD解码器1209可通过对比特流进行解码来产生频谱。另外,根据当前实施例,FD解码器1209可基于包括在比特流中的先前帧的模式信息对比特流执行解码。换句话说,如下面将参照图25所详细描述的,FD解码器1209可基于包括在比特流中的先前帧的模式信息来对FD编码的帧执行FD解码。下面将参照图12C详细描述FD解码器1209。
[0261] 频率反变换器1210对执行FD解码的结果执行频率反变换。频率反变换器1210通过对FD解码的频谱执行频率反变换来产生解码的信号。例如,频率反变换器1210可执行反MDCT,但是本发明不限于此。
[0262] 因此,解码设备102可基于比特流的每个帧的编码模式对比特流执行解码。
[0263] 图12C是根据本发明的实施例的包括在解码设备102中FD解码器1209的框图。
[0264] 图12C的FD解码器1209执行的解码处理是图12B的处理的逆处理。参照图12C,FD解码器1209可包括标准化解码器12091、FPC解码器12092、噪声填充执行单元12093和FD扩展解码器12094。FD扩展解码器12094可包括FD低频扩展解码器12095和FD高频扩展解码器12096。
[0265] 标准化解码器12091基于比特流的标准化信息来执行标准化解码。标准化信息可以是根据由图2C的标准化编码器2091编码的结果的信息。
[0266] FPC解码器12092基于比特流的FPC信息执行FPC解码。FPC信息可以是根据由图2C的阶乘脉冲编码器209编码的结果的信息。
[0267] 例如,与图2C的阶乘脉冲编码器2092执行的编码相似,FPC解码器12092通过分配在每个频带中可用的比特的数量来执行FPC解码。
[0268] 噪声填充执行单元12093对执行FPC解码的结果执行噪声填充。例如,噪声填充执行单元12093对被执行FPC解码的频带添加噪声。在这种情况下,如下面将参照图27所描述的,噪声填充执行单元12093添加噪声直到被执行FPC解码的频带的最后频带。
[0269] FD扩展解码器12094可包括FD低频扩展解码器12095和FD高频扩展解码器12096。
[0270] 如果执行FPC解码的频带的上频带值Ffpc小于执行FPC编码的频带的上频带值Fcore,则FD低频扩展解码器12095对执行FPC解码的结果和执行噪声填充的结果执行扩展解码。
[0271] 因此,FD低频扩展解码器12095通过使用由FPC解码和噪声填充产生的频谱来产生直到执行FPC编码的频带的上频带值Fcore的频谱。
[0272] 如上所述,可通过将FD低频扩展解码器12095产生的频谱与标准化解码器12091解码的标准化值相乘来产生解码的低频频谱。
[0273] 然而,当FD低频扩展解码器12095不进行操作时,可通过将执行FPC解码和执行噪声填充产生的频谱与标准化解码器12091解码的标准化值相乘来产生解码的低频频谱。
[0274] FD高频扩展解码器12096通过使用执行FPC解码和执行噪声填充的结果来执行高频扩展解码。在当前实施例中,FD高频扩展解码器12096操作与图2C的FD扩展编码器2094相应。
[0275] 例如,FD高频扩展解码器12096可基于比特流的高频能量信息对高频能量进行反量化,根据各种高频带宽扩展模式通过使用低频信号来产生高频信号的激励信号,并且根据应用增益使得激励信号的能量可与反量化的能量对称来产生解码的高频信号。例如,所述各种高频带宽扩展模式可包括标准模式、谐波模式或噪声模式。
[0276] 在这种情况下,如下面将参照图26所详细描述的,FD高频扩展解码器12096可通过针对不同的比特率共享相同的码本来执行能量的反量化。
[0277] 如果将被解码的帧是静止帧,则包括在FD解码器1209中的标准化解码器12091、FPC解码器12092、噪声填充执行单元12093和FD扩展解码器12094可进行操作。
[0278] 然而,如果将被解码的帧是瞬态帧,则FD扩展解码器12094可不操作。
[0279] 图12D是根据本发明的另一实施例的解码设备102的框图。
[0280] 图12D的解码设备102执行的解码处理是图2D的处理的逆处理。参照图12D,解码设备102可包括模式信息检查单元1211、LPC解码器1212、CELP解码器1213、TD扩展解码器1214、音频解码器1215和FD扩展解码器1216。
[0281] 模式信息检查单元1211检查包括在比特流中的每一帧的模式信息。比特流可以是发送到解码设备102的与根据由编码设备101执行编码的结果的比特流相应的信号。
[0282] 例如,模式信息检查单元1211从比特流解析模式信息,并且根据依据解析的结果的当前帧的编码模式,执行到CELP解码模式或FD解码模式中的一个的切换操作。
[0283] 更具体地,模式信息检查单元1211可针对包括在比特流中的每一帧,按照根据CELP模式编码的帧可被CELP解码并且根据FD模式编码的帧可被FD解码的方式进行切换。
[0284] LPC解码器1212对包括在比特流中的帧执行LPC解码。
[0285] CELP解码器1213基于检查的结果对根据CELP模式编码的帧执行CELP解码。例如,CELP解码器1213对自适应码本贡献和固定码本贡献进行解码,组合解码的结果,并产生与低频频带的解码的信号相应的低频信号。
[0286] TD扩展解码器1214通过使用执行CELP解码的结果和低频信号的激励信号中的至少一个来产生高频频带的解码的信号。低频信号的激励信号可被包括在比特流中。另外,TD扩展解码器1208可使用由LPC解码器1212解码的LPC信息来产生与高频频带的解码的信号相应的高频信号。
[0287] 另外,根据当前实施例,TD扩展解码器1214可通过将高频信号和CELP解码器1214产生的低频信号进行组合来产生解码的信号。为了产生解码的信号,TD扩展解码器1214可还对低频信号和高频信号的采样率执行转换操作,以使它们相同。
[0288] 音频解码器1215基于检查的结果对音频编码的帧执行音频解码。例如,音频解码器1215参照比特流,并且当存在时域贡献时,基于时域贡献值和频域贡献执行解码,或者当时域贡献不存在时,基于频域贡献执行解码。
[0289] 另外,音频解码器1215可通过对根据FPC或LVQ量化的信号执行频率反变换(例如,IDCT)来产生解码的低频激励信号,并且通过组合激励信号和反量化的LPC来产生解码的低频信号。
[0290] FD解码器1216通过使用执行音频解码的结果来执行扩展解码。例如,FD解码器1216将解码的低频信号转换为适合于执行高频扩展解码的采样率,并且对转换的信号执行频率变换(例如,MDCT)。FD扩展解码器1216可对量化的高频能量进行反量化,根据各种高频带宽扩展模式通过使用低频信号来产生高频信号的激励信号,并且根据按照激励信号的能量可与反量化的能量对称的方式应用增益来产生解码的高频信号。例如,所述各种高频带宽扩展模式可包括标准模式、谐波模式、瞬态模式或噪声模式。
[0291] 另外,FD扩展解码器1216通过对解码的高频信号和低频信号执行频率反变换(例如,反MDCT)来产生解码的信号。
[0292] 另外,如果瞬态模式被用于高频带宽扩展,则FD扩展解码器1216可应用在时域计算的增益,使得在执行频率反变换之后解码的信号可与解码的时域包络匹配,并且组合应用了增益的信号。
[0293] 因此,解码设备102可基于包括在比特流中的每一帧的编码模式对比特流执行解码。
[0294] 图13是根据本发明的实施例的包括在解码设备102中的扩展解码器1304的框图。
[0295] 参照图13,扩展解码器1204可包括反量化器1301、增益计算器1302、增益应用单元1303、人工信号产生器1304、包络估计器1305和包络应用单元1306。
[0296] 反量化器1301可对输入信号的能量进行反量化。下面将参照图14详细描述对输入信号的能量进行反量化的处理。
[0297] 增益计算器1302可基于反量化的能量和基信号的能量来计算将应用到基信号的增益。详细地,可通过反量化的能量和基信号的能量之间的比率来确定增益。一般而言,通过使用频谱的振幅的平方和来确定能量。因此,反量化的能量和基信号的能量之间的比率的平方根可被使用。
[0298] 增益应用单元1303可应用用于每个频带的增益来确定SWB的频谱。
[0299] 例如,如上所述,可通过使用用于发送能量的频带对频带进行均衡来执行增益计算和增益应用。根据本发明的另一实施例,可通过将整个频带划分为子频带来执行增益计算和增益应用,以防止能量的剧烈变化。在这种情况下,可通过对相邻频带的反量化的能量进行插值来平滑处于频带的边界的能量。例如,可通过以下步骤执行增益计算和增益应用:将每个频带划分为三个子频带,将当前频带的反量化的能量分配到每个频带的三个子频带中的中间子频带,并使用分配到先前频带或随后频带的中间频带的能量和通过插值新近平滑的能量。也就是说,可以以子频带为单位计算和应用增益。
[0300] 这样的能量平滑方法可被应用为固定类型。另外,通过从扩展编码器204发送指示需要能量平滑的信息,能量平滑方法可仅被应用到需要的帧。在这种情况下,指示需要能量平滑的信息可被设置,使得当执行能量平滑时的整个能量中的量化误差比当不执行能量平滑时的整个能量中的量化误差低。
[0301] 可通过使用频域中的输入信号来产生基信号。可如下面的描述执行产生基信号的处理。
[0302] 人工信号产生器1304可通过复制和折叠频域中的输入信号的低频频带来产生与高频频带相应的人工信号。频域中的输入信号可以是具有32KHz的采样率的解码的宽带(WB)信号。
[0303] 包络估计器1305可通过使用包括在比特流中的窗口来估计基信号的包络。所述窗口可被编码设备101使用以估计包络,关于窗口的类型的信息可作为比特类型被包括在比特流,并且被发送到解码设备102。
[0304] 包络应用单元1306可通过对人工信号应用估计的包络来产生基信号。
[0305] 当包括在编码设备101中的包络估计器602将每个白化频带的频率幅度的平均值估计为属于所述白化频带的频率的包络时,如果指示属于白化频带的频谱的数量是大还是小的信息被发送到解码设备102,则解码设备102的包络估计器1305可基于发送的方法估计包络。随后,包络应用单元1306可对人工信号应用估计的包络。否则,在不必不得不发送所述信息的情况下,可根据宽带(WB)核心解码器使用的核心编码模式来确定包络。
[0306] 核心解码器1201可通过基于信号的特征将信号的编码模式分类为有声编码模式、无声编码模式、瞬态编码模式和一般编码模式以对信号进行解码。在这种情况下,包络估计器602可基于根据输入信号的特征的解码模式来控制属于白化频带的频谱的数量。例如,如果根据有声解码模式对输入信号进行解码,则包络估计器1305可通过在白化频带中形成三个频谱来估计包络。如果输入信号按照除了有声解码模式以外的解码模式被解码,则包络估计器1305可通过在白化频带中形成三个频谱来估计包络。
[0307] 图14是示出根据本发明的实施例的包括在扩展解码器1304中的反量化器1301的操作的流程图。
[0308] 在操作S1401,反量化器1301可基于从编码设备101接收到的索引对能量矢量的选择的子矢量进行反量化。
[0309] 在操作S1402,反量化器1301可基于接收到的索引对与未被选择的其余子矢量相应的插值误差进行反量化。
[0310] 在操作S1403,反量化器1301可通过对反量化的子矢量进行插值来计算其余的子矢量。随后,反量化器1301可将反量化的插值误差添加到其余的子矢量。另外,反量化器1301可通过后处理操作,通过添加在预处理操作期间被减去的平均值来计算反量化的能量。
[0311] 图15A是示出根据本发明的实施例的编码方法的流程图。
[0312] 在操作S1501,编码设备101可对输入信号进行下采样。
[0313] 在操作S1502,编码设备101可对下采样的输入信号进行核心编码。
[0314] 在操作S1503,编码设备101可对输入信号执行频率变换。
[0315] 在操作S1504,编码设备101可对频域中的输入信号执行带宽扩展编码。例如,编码设备101可通过使用通过核心编码确定的编码信息来执行带宽扩展编码。在这种情况下,当执行核心编码时,编码信息可包括根据输入信号的特征被分类的编码模式。
[0316] 例如,编码设备101可如下面的描述来执行带宽扩展编码。
[0317] 编码设备101可通过使用频域中的输入信号的频谱来产生频域中的输入信号的基信号。作为另一示例,编码设备101可基于输入信号的频谱和特征来产生频域中的输入信号的基信号。在这种情况下,可通过核心编码或通过额外的信号分类来得到输入信号的特征。编码设备101可通过使用所述基信号来估计能量控制因子。编码设备101可从频域中的输入信号提取能量。随后,编码设备101可通过使用能量控制因子来控制提取的能量。编码设备
101可对控制的能量进行量化。
[0318] 可如下面的描述产生基信号。
[0319] 编码设备101可通过复制和折叠频域中的输入信号的低频频带来产生与高频频带相应的人工信号。随后,编码设备101可使用窗口来估计基信号的包络。在这种情况下,编码设备101可通过音调或相关性比较来选择窗口,以估计基信号的包络。例如,编码设备101可将每个白化频带的频率幅度的平均值估计为属于每个白化频带的频率的包络。详细地,编码设备101可根据核心编码模式,通过控制输入白化频带的频谱的数量来估计基信号的包络。
[0320] 随后,编码设备101可对人工信号应用估计的包络,从而产生基信号。
[0321] 可如下面的描述估计能量控制因子。
[0322] 编码设备101可计算频域中的输入信号的高频频带的音调。编码设备101可计算基信号的音调。随后,编码设备101可通过使用输入信号的高频频带的音调和基信号的音调来计算能量控制因子。
[0323] 可如下面的描述执行控制的能量的量化。
[0324] 编码设备101可选择子矢量并对子矢量进行量化,通过使用插值误差对其余子矢量进行量化。在这种情况下,编码设备101可以以相同的时间间隔选择子矢量。
[0325] 例如,编码设备101可通过选择子矢量候选使用至少两个级来执行MSVQ。在这种情况下,编码设备101可产生索引集来最小化每一级中的每个子矢量候选的MSE或WMSE,并且从子矢量候选中选择在所有级中具有MSE或WMSE的最小和的子矢量候选。否则,编码设备101可产生索引集来最小化每一级中的每个子矢量候选的MSE或WMSE,通过反量化重构能量矢量,并且选择子矢量候选来满足重构的能量矢量和原始能量矢量之间的MSE或WMSE。
[0326] 图15B是示出根据本发明的另一实施例的编码方法的流程图。图15B的编码方法可包括由图2A到图2C中的一个的编码设备101顺序执行的操作。因此,虽然这里未描述,但上面参照图2A到图2C的编码设备101的描述也可被应用于图15B的编码方法。
[0327] 在操作S1505,信号分类单元205基于输入信号的特征来确定输入信号的编码模式。
[0328] 在操作S1506,如果输入信号的编码模式被确定为CELP模式,则CELP编码器206对输入信号的低频信号执行CELP编码。
[0329] 在操作S1507,如果对输入信号的低频信号执行CELP编码,则TD扩展编码器207对输入信号的高频信号执行TD扩展编码。
[0330] 在操作S1508,如果输入信号的编码模式被确定为FD模式,则频率变换器208对输入信号执行频率变换。
[0331] 在操作S1509,FD编码器209对频率变换的输入信号执行FD编码。
[0332] 图15C示出根据本发明的另一实施例的编码方法的流程图。图15C的编码方法可包括由图2A到图2C中的一个的编码设备101顺序执行的操作。因此,虽然这里未描述,但上面参照图2A到图2C的编码设备101的描述也可被应用于图15C的编码方法。
[0333] 在操作S1510,信号分类单元210基于输入信号的特征来确定输入信号的编码模式。
[0334] 在操作S1511,LPC编码器211从输入信号的低频信号提取LPC,并且对LPC进行量化。
[0335] 在操作S1512,如果输入信号的编码模式被确定为CELP模式,则CELP编码器212对使用LPC提取的LPC激励信号执行CELP编码。
[0336] 在操作S1513,如果对输入信号的低频信号的LPC激励信号执行CELP编码,则TD扩展编码器213对输入信号的高频信号执行TD扩展编码。
[0337] 在操作S1514,如果输入信号的编码模式被确定为FD模式,则音频编码器214对使用LPC提取的LPC激励信号执行音频编码。
[0338] 在操作S1515,如果对输入信号的低频信号的LPC激励信号执行FD编码,则FD扩展编码器215对输入信号的高频信号执行FD扩展编码。
[0339] 图16是示出根据本发明的实施例的解码方法的流程图。
[0340] 在操作S1601,解码设备102可对包括在比特流中的核心编码的输入信号执行核心解码。
[0341] 在操作S1602,解码设备102可对核心解码的输入信号进行上采样。
[0342] 在操作S1603,解码设备102可对上采样的输入信号执行频率变换。
[0343] 在操作S1604,解码设备102可通过使用频域中的输入信号和关于包括在比特流中的输入信号的能量的信息来执行带宽扩展解码。
[0344] 更具体地,可如下面的描述执行带宽扩展。
[0345] 解码设备102可对输入信号的能量进行反量化。在这种情况下,解码设备101可选择子矢量,并且对子矢量进行反量化,对反量化的子矢量进行插值,对插值的子矢量添加插值误差,从而对能量进行反量化。
[0346] 另外,解码设备102可产生频域中的输入信号的基信号。随后,解码设备102可通过使用反量化的能量和基信号的能量来计算将被应用于基信号的增益。之后,解码设备102可为每个频带应用所述增益。
[0347] 可如下面的描述产生基信号。
[0348] 解码设备102可通过复制和折叠频域中的输入信号的低频频带来产生与输入信号的高频频带相应的人工信号。随后,解码设备102可通过使用包括在比特流中的窗口信息来估计基信号的包络。在这种情况下,如果窗口信息被设置为相同,则没有窗口信息被包括在比特流中。之后,解码设备102可对人工信号应用估计的包络。
[0349] 图16B是示出根据本发明的另一实施例的解码方法的流程图。图16B的解码方法可包括由图12A到12C中的一个的解码设备102顺序执行的操作。因此,虽然这里未描述,但是上面参照图12A到图12C的解码设备102的描述也可被应用于图16B的解码方法。
[0350] 在操作S1606,模式信息检查单元1206检查包括在比特流中的每一帧的模式信息。
[0351] 在操作S1607,CELP解码器1207基于检查的结果对CELP编码的帧执行CELP解码。
[0352] 在操作S1608,TD扩展解码器1208通过使用执行CELP解码的结果和低频信号的激励信号中的至少一个来产生高频频带的解码的信号。
[0353] 在操作S1609,FD解码器1209基于检查的结果对FD编码的帧执行FD解码。
[0354] 频率反变换器1210对执行FD解码的结果执行频率反变换。
[0355] 图16C是示出根据本发明的另一实施例的解码方法的流程图。图16C的解码方法可包括由图12A到12C中的一个的解码设备102顺序执行的操作。因此,虽然这里未描述,但是上面参照图12A到图12C的解码设备102的描述也可被应用于图16C的解码方法。
[0356] 在操作S1611,模式信息检查单元1211检查包括在比特流中的每一帧的模式信息。
[0357] 在操作S1612,LPC解码器1212对包括在比特流中的帧执行LPC解码。
[0358] 在操作S1613,CELP解码器1213基于检查的结果对CELP编码的帧执行CELP解码。
[0359] 在操作S1614,TD扩展解码器1214通过使用执行CELP解码的结果和低频信号的激励信号中的至少一个来产生高频频带的解码的信号。
[0360] 在操作S1615,音频解码器1215基于检查的结果对音频编码的帧执行音频解码。
[0361] 在操作S1616,FD扩展解码器1216通过使用执行音频解码的结果来执行FD扩展解码。
[0362] 关于参照图15到图16未描述的关于编码和解码方法的其它事项,应该参考参照图1到图14的描述。
[0363] 图17是根据本发明的另一实施例的编码设备1702的整体结构的框图。
[0364] 参照图17,编码设备100可包括编码模式选择器1701和扩展编码器1702。
[0365] 编码模式选择器1701可通过使用频域中的输入信号和时域中的输入信号来确定带宽扩展编码的编码模式。
[0366] 更具体地,编码模式选择器1701可通过使用频域中的输入信号和时域中的输入信号来对频域中的输入信号进行分类,并且基于分类的结果,根据编码模式来确定带宽扩展编码的编码模式和频带的数量。这里,编码模式可被设置为与当执行核心编码时确定的编码模式不同的的编码模式的新的集合,用于提高扩展编码器1702的性能。
[0367] 例如,编码模式可被分类为标准模式、谐波模式、瞬态模式和噪声模式。首先,编码模式选择器1701基于时域中的输入信号的长期能量和当前帧的高频频带的能量之间的比率来确定当前帧是否为瞬态帧。瞬态信号的部分是在时域中发生能量的剧烈改变的部分,并且因此可以是高频频带的能量剧烈改变的部分。
[0368] 现在将描述确定其它三种编码模式的处理。首先,获得先前帧和当前帧的整体能量,整体能量和频域中的信号之间的比率被划分为预定频带,随后基于每个频带的平均能量和峰值能量来确定所述三种编码模式。一般而言,在谐波模式中,频域中的信号的峰值能量和平均能量之间的差是最大的。在噪声模式中,信号的能量的改变程度整体小。除了所述两种信号以外的其它信号的编码模式被确定为标准模式。
[0369] 根据本发明的实施例,频带的数量在标准模式和谐波模式中可被确定为十六,在瞬态模式中可被确定为五,在标准模式中可被确定为十二。
[0370] 扩展编码器1702可通过使用频域中的输入信号和时域中的输入信号来选择带宽扩展编码的编码模式。参照图17,扩展编码器1702可包括基信号产生器1703、因子估计器1704、能量提取器1705、能量控制器1706和能量量化器1707。基信号产生器1703和因子估计器1704是如上面参照图5所描述的。
[0371] 能量提取器1705可根据依据编码模式确定的频带的数量来提取与每个频带相应的能量。可根据编码模式确定使用或不使用基信号产生器1703、因子估计器1704和能量控制器1706。例如,这些元件可在标准模式和谐波模式中被使用,但是在瞬态模式和噪声模式中可不被使用。基信号产生器1703、因子估计器1704和能量控制器1706是如上面参照图5所描述的。可由能量量化器1707对被执行能量控制的频带的能量进行量化。
[0372] 图18是示出根据本发明的另一实施例的能量量化器1707的操作的流程图。
[0373] 能量量化器1707可根据编码模式对从输入信号中提取的能量进行量化。在这种情况下,能量量化器1707可根据编码模式,基于频带能量的数量和输入信号的感知特征对将针对输入信号优化的频带的能量进行量化。
[0374] 例如,如果编码模式是瞬态模式,则能量量化器1707可针对五个频带能量,基于输入信号的感知特征通过使用频率加权方法对频带能量进行量化。如果编码模式是标准模式或谐波模式,则能量量化器1707可针对十六个频带能量,基于输入信号的感知特征通过使用非均匀比特分配方法对频带能量进行量化。如果输入信号的特征不明确,则能量量化器1707可根据一般方法而不是考虑输入信号的感知特征来执行量化。
[0375] 图19是示出根据本发明的实施例的通过使用非均匀比特分配方法对能量进行量化的处理的示图。
[0376] 在非均匀比特分配方法中,考虑作为扩展编码的目标的输入信号的感知特征。因此,感知高重要性的相对低频频带可因此根据非均匀比特分配方法被更精确地量化。为了这个目的,与分配到其它频带的比特的数量相比,能量量化器1707可通过将相同数量的比特或更多数量的比特分配到相对低频频带来对感知重要性进行分类。
[0377] 例如,能量量化器1707将较大量的比特分配到分配有编号“0”到“5”的相对低频频带。分配到分配有编号“0”到“5”的相对低频频带的比特的数量可以是相同的。频带越高,能量量化器1707分配到所述频带的比特的数量越小。因此,可如图19中所示根据如上所述的比特分配对分配有编号“0”到“13”的频带进行量化。可如图20中所示对分配有编号“14”和“15”的其它频带进行量化。
[0378] 图20是示出根据本发明的实施例的使用帧内预测的矢量量化的示图。
[0379] 能量量化器1707预测具有至少两个元素的量化目标矢量的代表值,并且可随后对量化目标矢量的每个元素和预测的代表值之间的误差信号执行矢量量化。
[0380] 图20示出这样的帧内预测方法。预测量化目标矢量的代表值并且获得误差信号的方法如下:
[0381] p=0.4*QEnv(12)+0.6*QEnv(13)
[0382] e(14)=Env(14)-p
[0383] e(15)=Env(15)-p...(8)
[0384] 其中,“Env(n)”表示未被量化的频带能量,“QEnv(n)”表示被量化的频带能量,“p”表示量化目标矢量的预测的代表值,“e(n)”表示误差能量。在等式(8)中,“e(14)”和“e(15)”是量化的矢量。
[0385] 图21是示出根据本发明的另一实施例的通过使用频率加权方法对能量进行量化的处理的示图。
[0386] 在频率加权方法中,如在非均匀比特分配方法中,通过考虑作为扩展编码的目标的输入信号的感知特征,感知高重要性的相对低频频带可因而被更精确地量化。为了这个目的,与分配到其它频带的权重相比,通过将相同的权重或更高的权重分配到相对低频频带来对感知重要性进行分类。
[0387] 例如,参照图21,能量量化器1707可通过将较高权重(例如,1.0)分配到分配有编号“0”到“3”的相对低频频带,并且将较低权重(例如,0.7)分配到分配有编号“15”的频带来执行量化。为了使用分配的权重,能量量化器1707可通过使用WMSE来计算最优索引。
[0388] 图22是示出根据本发明的实施例的多级划分的矢量量化和通过使用帧内预测的矢量量化的示图。
[0389] 如图22中所示,能量量化器1707可按照频带能量的数量是十六的标准模式执行矢量量化。这里,能量量化器1707可通过使用非均匀比特分配方法、帧内预测和具有能量插值的多级划分VQ来执行矢量量化。
[0390] 图23是示出根据本发明的实施例的包括在解码设备102中的反量化器1301的操作的示图。
[0391] 图23的反量化器1301的操作可以是图18的能量量化器1710的操作的逆操作。当如参照图17所描述的,编码模式被用于执行扩展编码时,反量化器1301可对编码模式的信息进行解码。
[0392] 首先,反量化器1301通过使用接收到的索引对编码模式的信息进行解码。随后,反量化器1301根据编码模式的解码的信息执行反量化。参照图23,根据编码模式,作为反量化的目标的按照执行量化的相反顺序被反量化。
[0393] 根据具有能量插值的多级划分VQ被量化的部分可如图14中所示被反量化。反量化器1301可通过使用下面的等式执行使用帧内预测的反量化:
[0394] p=0.4*QEnv(12)+0.6*QEnv(13)
[0395]
[0396]
[0397] 其中,“Env(n)”表示未被量化的频带能量,“QEnv(n)”表示被量化的频带能量。另外,“p”表示量化目标矢量的代表值,“e^(n)”表示量化的误差能量。
[0398] 图24是根据本发明的另一实施例的编码设备101的框图。
[0399] 除了扩展编码器2402不从核心编码器2404接收任何信息,并且可直接接收时域中的输入信号以外,在图24中示出的编码设备101的元件的基本操作与在图2A中示出的编码设备101的元件的基本操作相同。
[0400] 图25是示出根据本发明的实施例的比特流的示图。
[0401] 参照图25,比特流251、比特流252和比特流253分别与第N帧、第(N+1)帧和第(N+2)帧相应。
[0402] 参照图25,比特流251、比特流253和比特流253包括报头254和有效载荷255。
[0403] 报头254可包括模式信息2511、2521和2531。模式信息2511、2521和2531分别是第N帧、第(N+1)帧和第(N+2)帧的编码模式信息。例如,模式信息2511表示用对第N帧进行编码的编码模式,模式信息2521表示用于对第(N+1)帧进行编码的编码模式,模式信息2531表示用于对第(N+2)帧进行编码的编码模式。例如,编码模式可包括CELP模式、FD模式和音频编码模式中的至少一个,但是本发明不限于此。
[0404] 有效载荷255包括关于根据这些帧的编码模式的核心数据的信息。
[0405] 例如,在按照CELP模式对第N帧进行编码的情况下,有效载荷255可包括CELP信息2512和TD扩展信息2513。
[0406] 在按照FD模式编码的第(N+1)帧的情况下,有效载荷255可包括FD信息2523。在按照FD模式编码的第(N+2)帧的情况下,有效载荷255可包括FD信息2532。
[0407] 与第(N+1)帧相应的比特流252的有效载荷255可还包括预测数据2522。换句话说,邻近帧之间的编码模式从CELP模式切换为FD模式,根据执行根据FD模式进行编码的结果的比特流252可包括预测数据2522。
[0408] 更具体地说,如图2B中所示,当能够在CELP模式和FD模式之间切换的编码设备101根据FD模式执行编码时,包括重叠帧的频率变换(例如,MDCT)被使用。
[0409] 因此,如果分别根据CELP模式和FD模式对输入信号的第N帧和第(N+1)帧进行编码,则第(N+1)帧不能通过仅使用根据FD模式进行编码的结果被解码。为此,如果邻近帧之间的编码模式从CELP模式切换到FD模式,则根据执行根据FD模式进行编码的结果的比特流252可因此包括代表与预测相应的信息的预测数据2522。
[0410] 因此,解码侧可基于包括在比特流252中的预测数据2522,通过使用当前帧(例如,第(N+1)帧)的解码的时域信息和对先前帧(例如,第N帧)进行解码的结果,通过预测对根据FD模式编码的比特流252进行解码。例如,所述时域信息可以是时域混叠(time-domain aliasing),但是本发明不限于此。
[0411] 另外,与第(N+1)帧相应的比特流252的有效载荷255可还包括先前帧模式信息2524,与第(N+2)帧相应的比特流253的有效载荷255可还包括先前帧模式信息2533。
[0412] 更具体地,根据FD模式编码的比特流252和比特流253可还分别包括先前帧模式信息2524和2533。
[0413] 例如,包括在与第(N+1)帧相应的比特流252中的先前帧模式信息2524可包括关于第N帧的模式信息2511的信息,包括在与第(N+2)帧相应的比特流253中的先前帧模式信息2533可包括关于第(N+1)帧的模式信息2524的信息。
[0414] 因此,即使在多个帧中的一帧中发生错误,解码侧也可准确检测模式瞬变。
[0415] 图26是示出根据本发明的实施例的为每个频带执行频率分配的方法的示图。
[0416] 如上所述,图2C的FD扩展编码器2094或图2D的FD扩展编码器215可通过以不同的比特率共享相同的码本来执行能量量化。因此,当与输入信号相应的频谱被划分为预定数量的频带时,即使以不同的比特率,FD扩展编码器2094或FD扩展编码器215也可将相同的带宽分配给每个频带。
[0417] 现在将描述约6.4kHz到14.4kHz的频带以16kbps的比特率被划分的情况261和约8kHz到16kHz的频带以等于或大于16kbps的比特率被划分的情况262。在这些情况下,即使以不同的比特率,每个频带的带宽也是相同的。
[0418] 即,以16kbps的比特率和等于或大于16kbps的比特率,第一频带的带宽263可以是0.4kHz,以16kbps的比特率和等于或大于16kbps的比特率,第二频带的带宽264可以是
0.6kHz。
[0419] 如上所述,由于即使以不同的比特率,每个频带的带宽也被设置为相同,所以根据当前实施例的FD扩展编码器2094或FD扩展编码器215可通过以不同的比特率共享相同的码本来执行能量量化。
[0420] 因此,在在CELP模式和FD模式之间或在CELP模式和音频编码模式之间执行切换的配置中,可执行多模式带宽扩展,并且执行码本共享来支持各种比特率,从而减少例如只读存储器(ROM)的大小,并且简化实现。
[0421] 图27是示出根据本发明的实施例的在FD编码器或FD解码器中使用的频带271的示图。
[0422] 参照图27,频带271可以是根据每个工具而可在例如图2B的FD编码器209和图12B的FD解码器1209中使用的频带的示例。
[0423] 更具体地,FD编码器209的阶乘脉冲编码器2902根据比特率限制用于执行FPC编码的频带。例如,用于执行FPC编码的频带Fcore根据比特率可以是6.4kHz、8kHz或9.6kHz,但是本发明不限于此。
[0424] 可通过在由阶乘脉冲编码器2092限制的频带中执行FPC来确定阶乘脉冲编码的频带Ffpc 272。在这种情况下,FD解码器1209的噪声填充执行单元12093在脉冲阶乘编码的频带Ffpc 272中执行噪声填充。
[0425] 在这种情况下,如果阶乘脉冲编码的频带Ffpc 272的上频带值小于用于执行FPC的频带Fcore的上频带值,则FD解码器1209的FD低频扩展解码器12095可执行低频扩展解码。
[0426] 参照图27,FD低频扩展解码器12095可在不包括阶乘脉冲编码的频带Ffpc的,频带Fcore的其余频带273中执行FD低频扩展解码。然而,如果频带Fcore与阶乘脉冲编码的频带Ffpc 272相同,则FD低频扩展解码可不被执行。
[0427] FD解码器1209的FD高频扩展解码器12096可根据比特率在频带Fcore的上频带值和频带Fend的上频带值之间的频带274中执行FD高频扩展解码。例如,频带Fend的上频带值可以是14kHz、14.4kHz或16kHz,但是本发明不限于此。因此,通过使用根据本发明的实施例的编码设备101和解码设备102,可通过各种切换系统以不同的比特率有效地对语音和音乐进行编码。另外,可通过共享码本来执行FD扩展编码和FD扩展解码。因此,即使当存在各种配置时,可以以较不复杂的方式来实现高质量音频。另外,由于当执行FD编码时,关于先前帧的模式信息被包括在比特流中,因此即使当发生帧差错时也可准确执行解码。因此,使用编码设备101和解码设备102,可以以低复杂度和低延迟来执行编码和解码。
[0428] 因此,根据3GPPP增强语音服务(EVS)的语音信号和音乐信号可被适当编码和解码。
[0429] 根据本发明的各种实施例的上述方法可被实现为可由各种类型的计算机工具运行并且被记录在计算机可读记录介质上的计算机程序。计算机可读记录介质可存储程序命令、数据文件、数据结构或它们的组合。所述程序命令可根据本发明而被特别设计或构造,或者可以是在计算机软件领域中公知的。
[0430] 虽然已经参照本发明的示例性实施例具体示出和描述了本发明,但是本领域的普通技术人员将理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可在其中进行形式和细节上的各种改变。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈