首页 / 专利库 / 工艺品 / 音调 / 用于快速CELP参数映射的方法和装置

用于快速CELP参数映射的方法和装置

阅读:140发布:2022-10-31

专利汇可以提供用于快速CELP参数映射的方法和装置专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种用于在源编 解码器 和目的地编解码器之间映射CELP参数的装置,该装置包括LSP映射模 块 、耦合到LSP映射模块的自适应码本映射模块以及耦合到LSP映射模块和自适应码本映射模块的固定码本映射模块。LSP映射模块包括LP溢出模块和LSP参数 修改 模块。自适应码本映射模块包括第一基音增益码本。固定码本映射模块包括第一目标处理模块、脉冲搜索模块、固定码本增益估计模块和脉冲 位置 搜索模块。,下面是用于快速CELP参数映射的方法和装置专利的具体信息内容。

1.一种用于在源编解码器和目的地编解码器之间映射CELP参数的装 置,该装置包括:
LSP映射模
耦合到所述LSP映射模块的自适应码本映射模块;
耦合到所述LSP映射模块和所述自适应码本映射模块的固定码本映射 模块;
其中所述LSP映射模块包括:
LP溢出模块,该模块被配置为处理与多个内插LSP参数相关联的信 息,并且至少基于与所述多个内插LSP参数相关联的信息来产生溢出信 号;
LSP参数修改模块,该模块被配置为响应于所述溢出信号,来修改所 述多个内插LSP参数中的至少一个内插LSP参数的至少一个频率
其中所述自适应码本映射模块包括第一基音增益码本,该第一基音增 益码本包括第一多个条目,所述第一多个条目中的每一个条目都包括多个 项以及与所述多个项相关联的多个和;
其中所述固定码本映射模块包括:
第一目标处理模块,该模块被配置为处理第一目标信号并且产生第一 修改目标信号;
脉冲搜索模块,该模块被配置为至少基于与所述第一修改目标信号相 关联的信息,来确定子中多个脉冲的第一多个脉冲位置和符号;
固定码本增益估计模块,该模块被配置为至少基于与所述第一多个脉 冲位置和符号相关联的信息来估计所述子帧的固定码本增益;
脉冲位置搜索模块,该模块被配置为接收所述第一修改目标信号、冲 激响应信号和已估计的固定码本增益,并且输出所述多个脉冲的第二多个 脉冲位置和符号。
2.如权利要求1所述的装置,其中所述LSP参数修改模块还被配置为 响应于所述溢出信号,来增大或减小所述多个内插LSP参数中的至少一个 内插LSP参数的至少一个频率。
3.如权利要求2所述的装置,其中所述LSP参数修改模块基本上不发 生信号质量的降低。
4.如权利要求2所述的装置,其中所述目的地编解码器的解码器不会 发生信号溢出。
5.如权利要求1所述的装置,其中所述多个项与基音滤波器的第一抽 头的第一增益系数所涉及的至少一个元素相关联,并且所述多个和与多个 乘积相关联,所述多个乘积至少与所述基音滤波器的第二抽头的第二增益 系数和所述基音滤波器的第三抽头的第三增益系数相关联。
6.如权利要求5所述的装置,其中所述基音滤波器的第二抽头与所述 基音滤波器的第三抽头相同。
7.如权利要求1所述的装置,其中所述自适应码本映射模块与包括多 抽头基音滤波器在内的目的地编解码器相关联。
8.如权利要求1所述的装置,其中所述脉冲位置搜索模块包括:
单个音轨脉冲搜索模块,该模块被配置为确定第一音轨中的至少一个 脉冲的至少一个位置和一个符号;
目标更新模块,该模块被配置为从所述第一目标信号中除去所述至少 一个脉冲的成分,并且输出第一更新目标信号;
第二目标处理模块,该模块被配置为接收所述第一更新目标信号,并 且输出第二修改目标信号;
缓冲区模块,该模块被配置为存储所述第一音轨中的所述至少一个脉 冲的所述至少一个位置和一个符号,并且输出所述多个脉冲的第二多个脉 冲位置和符号。
9.如权利要求8所述的装置,其中所述脉冲位置搜索模块还包括被配 置来选择所述第一音轨的音轨选择模块。
10.如权利要求1所述的装置,其中所述固定码本映射模块与固定码 本相关联,所述固定码本是代数固定码本或多脉冲固定码本。
11.如权利要求1所述的装置,其中所述固定码本映射模块与包括稀 疏固定码本在内的目的地编解码器相关联。
12.如权利要求1所述的装置,其中所述LSP映射模块、所述自适应 码本映射模块和所述固定码本映射模块与涉及G.723.1的目的地编解码器 相关联。
13.如权利要求1所述的装置,其中所述LSP映射模块、所述自适应 码本映射模块和所述固定码本映射模块与涉及GSM-AMR的目的地编解码 器相关联。
14.如权利要求1所述的装置,其中所述LSP映射模块还包括:
LSP量化模块,该模块被配置为至少基于与目的地编解码器所涉及的 多个量化表相关联的信息,来量化所述多个内插LSP参数;
LSP解码器及稳定性检查模块,该模块被配置为对已量化的多个内插 LSP参数进行解码。
15.如权利要求14所述的装置,其中所述LSP解码器及稳定性检查模 块还被配置为处理与所述已解码的多个内插LSP参数中的第一参数和第二 参数之间的顺序和间隔相关联的信息,所数第一参数和第二参数彼此相 邻。
16.如权利要求1所述的装置,其中所述自适应码本映射模块还包 括:
自适应码本目标产生模块,该模块被配置为产生第二目标信号;
自适应码本,该自适应码本被配置为存储多个激励信号
候选延迟选择模块,该模块被配置为接收开环基音延迟,并且产生候 选基音延迟值;
候选矢量信号产生模块,该模块被配置为至少基于与所述自适应码本 和所述候选基音延迟值相关联的信息,来产生多个候选信号;
自相关和互相关模块,该模块被配置为计算所述第二目标信号和所述 多个候选信号的延迟版本之间或者所述多个候选信号的所述延迟版本之间 的一组点积,并且输出至少与所述这组点积相关联的矢量信号;
增益码矢选择模块,该模块被配置为接收所述矢量信号,从而估计与 所述第一基音增益码本相关联的条目和所述接收到的矢量信号的点积,至 少处理与所述点积以及预定值相关联的信息,并且输出被选码矢的索引和 与所述被选码矢相关联的自适应码本基音延迟;
缓冲区模块,该模块存储所述被选码矢的索引以及所述自适应码本基 音延迟。
17.如权利要求16所述的装置,其中所述预定值是预定的最大值。
18.如权利要求16所述的装置,其中所述第一多个条目与目的地编解 码器的第二基音增益码本的第二多个条目进行相关。
19.如权利要求16所述的装置,其中所述矢量信号与所述多个项和所 述多个和相关联。
20.如权利要求1所述的装置,其中所述固定码本映射模块包括:
固定码本目标产生模块,该模块被配置为产生所述第一目标信号;
码矢构建模块,该模块被配置为接收所述第二多个脉冲位置和符号, 从而至少基于与所述第二多个脉冲位置和符号相关联的信息来产生固定码 本矢量,并且至少基于与所述第二多个脉冲位置和符号相关联的信息来确 定所述子帧的固定码本索引。
21.如权利要求1所述的装置,其中所述LSP映射模块、所述自适应 码本映射模块和所述固定码本映射模块被配置为彼此独立操作。
22.一种用于在源编解码器和目的地编解码器之间映射LSP参数的装 置,该装置包括:
LP溢出模块,该模块被配置为处理与多个内插LSP参数相关联的信 息,并且至少基于与所述多个内插LSP参数相关联的信息来产生溢出信 号;
LSP参数修改模块,该模块被配置为响应于所述溢出信号,来修改所 述多个内插LSP参数中的至少一个内插LSP参数的至少一个频率;
LSP量化模块,该模块被配置为至少基于与目的地编解码器所涉及的 多个量化表相关联的信息,来量化所述多个内插LSP参数;
LSP解码器及稳定性检查模块,该模块被配置为对已量化的多个内插 LSP参数进行解码。
23.一种用于在源编解码器和目的地编解码器之间映射自适应码本的装 置,该装置包括:
自适应码本目标产生模块,该模块被配置为产生目标信号;
基音增益码本,该基音增益码本包括多个条目,所述多个条目中的每 个条目都包括多个项和与所述多个项相关联的多个和;
候选延迟选择模块,该模块被配置为接收开环基音延迟,并且产生候 选基音延迟值;
候选矢量信号产生模块,该模块被配置为至少基于与所述自适应码本 和所述候选基音延迟值相关联的信息,来产生多个候选信号;
自相关和互相关模块,该模块被配置为计算所述目标信号和所述多个 候选信号的延迟版本之间或者所述多个候选信号的所述延迟版本之间的一 组点积,并且输出至少与所述这组点积相关联的矢量信号;
增益码矢选择模块,该模块被配置为接收所述矢量信号,从而计算与 所述基音增益码本相关联的条目和所述接收到的矢量信号的点积,至少处 理与所述点积以及预定值相关联的信息,并且输出被选码矢的索引和与被 选码矢相关联的自适应码本基音延迟;
缓冲区模块,该模块存储所述被选码矢的索引以及所述自适应码本基 音延迟。
24.一种用于在源编解码器和目的地编解码器之间映射固定码本的装 置,该装置包括:
固定码本目标产生模块,该模块被配置为产生目标信号;
目标处理模块,该模块被配置为处理所述目标信号并且产生第一修改 目标信号;
脉冲搜索模块,该模块被配置为至少基于与所述第一修改目标信号相 关联的信息,来确定子帧中多个脉冲的第一多个脉冲位置和符号;
固定码本增益估计模块,该模块被配置为至少基于与所述第一多个脉 冲位置和符号相关联的信息来估计所述子帧的固定码本增益;
脉冲位置搜索模块,该模块被配置为接收所述第一修改目标信号、冲 激响应信号和已估计的固定码本增益,并且输出所述多个脉冲的第二多个 脉冲位置和符号;
码矢构建模块,该模块被配置为接收所述第二多个脉冲位置和符号, 从而产生固定码本矢量,并且确定所述子帧的固定码本索引。
25.如权利要求23所述的装置,其中所述脉冲位置搜索模块包括:
单个音轨脉冲搜索模块,该模块被配置为确定第一音轨中的至少一个 脉冲的至少一个位置和一个符号;
目标更新模块,该模块被配置为从所述第一目标信号中除去所述至少 一个脉冲的成分,并且输出第一更新目标信号;
第二目标处理模块,该模块被配置为接收所述第一更新目标信号,并 且输出第二修改目标信号;
缓冲区模块,该模块被配置为存储所述第一音轨中的所述至少一个脉 冲的所述至少一个位置和一个符号,并且输出所述多个脉冲的所述第二多 个脉冲位置和符号。
26.一种用于在源编解码器和目的地编解码器之间映射CELP参数的方 法,该方法包括:
接收多个内插LSP参数、多个内插自适应码本参数和多个内插固定码 本参数;
至少基于与所述多个内插LSP参数相关联的信息来产生多个量化LSP 参数;
至少基于与所述多个内插自适应码本参数相关联的信息来产生多个量 化自适应码本参数;
至少基于与所述多个内插固定码本参数相关联的信息来产生多个量化 固定码本参数;
其中所述产生多个量化LSP参数的步骤包括至少基于与所述多个内插 LSP参数相关联的信息来产生溢出信号;
其中所述产生多个量化自适应码本参数的步骤包括估计与基音增益码 本相关联的条目和矢量信号之间的点积,所述基音增益码本包括多个条 目,所述多个条目中的每个条目都包括多个项以及与所述多个项相关联的 多个和;
其中所述产生多个量化固定码本参数的步骤包括:
至少基于与第一目标信号相关联的信息来产生第一修改目标信号;
至少基于与所述第一修改目标信号相关联的信息来确定子帧中的多个 脉冲的第一多个脉冲位置和符号;
至少基于与所述第一多个脉冲位置和符号相关联的信息来估计所述子 帧的固定码本增益;
至少基于与所述第一修改目标信号、冲激响应信号和所述估计出的固 定码本增益来产生所述多个脉冲的第二多个脉冲位置和符号。
27.如权利要求26所述的方法,其中所述产生多个量化LSP参数的步 骤还包括响应于所述溢出信号来修改所述多个内插LSP参数中的至少一个 内插LSP参数的至少一个频率。
28.如权利要求27所述的方法,其中所述修改多个内插LSP参数中的 至少一个内插LSP参数的至少一个频率的步骤包括:
如果与所述多个内插LSP参数中最前K个LSP参数相关联的第一和 大于第一预定值,则增大所述至少一个频率;
如果与所述多个内插LSP参数中最后K个LSP参数相关联的第二和 大于第二预定值,则减小所述至少一个频率;
其中K为正整数。
29.如权利要求27所述的方法,其中所述修改多个内插LSP参数中的 至少一个内插LSP参数的至少一个频率的步骤基本上不发生信号质量的降 低。
30.如权利要求27所述的方法,其中所述目的地编解码器的解码器不 会发生信号溢出。
31.如权利要求26所述的方法,其中所述产生多个量化LSP参数的步 骤还包括:
至少基于与目的地编解码器所涉及的多个量化表相关联的信息来量化 所述多个内插LSP参数;
对所述已量化的多个内插LSP参数进行解码;
处理与所述已解码的多个内插LSP参数中的第一参数和第二参数之间 的顺序和间隔相关联的信息,所述第一参数和第二参数彼此相邻。
32.如权利要求31所述的方法,其中所述产生多个量化LSP参数的步 骤还包括修改所述已解码的多个内插LSP参数。
33.如权利要求26所述的方法,其中所述产生多个量化自适应码本参 数的步骤包括:
产生第二目标信号;
产生多个候选基音延迟值;
至少基于与所述自适应码本和所述多个候选基音延迟值相关联的信息 来产生多个候选信号;
确定所述第二目标信号和所述多个候选信号的延迟版本之间或者所述 多个候选信号的所述延迟版本之间的一组点积;
产生至少与所述这组点积相关联的矢量信号;
确定与所述第一音调增益码本相关联的条目和所述接收到的矢量信号 之间的点积;
至少处理与所述点积和预定值相关联的信息;
输出被选码矢的索引以及与所述被选码矢相关联的自适应码本基音延 迟;
存储所述被选码矢的索引以及所述自适应码本基音延迟。
34.如权利要求33所述的方法,其中所述第二目标信号位于语音域、 经加权的语音域、激励域或者经滤波的激励域中。
35.如权利要求33所述的方法,其中所述多个候选信号与残差域目标 信号相关联,并且没有经过合成。
36.如权利要求26所述的方法,其中所述产生多个量化固定码本参数 的步骤包括:
至少基于与自适应码本成分和自适应码本目标信号相关联的信息来产 生所述第一目标信号;
至少基于与所述第二多个脉冲位置和符号相关联的信息来产生固定码 本矢量;
至少基于与所述第二多个码冲位置和符号相关联的信息来确定所述子 帧的固定码本索引。
37.如权利要求26所述的方法,其中所述产生多个脉冲的第二多个脉 冲位置和符号的步骤包括:
确定音轨中的至少一个脉冲的至少一个位置和一个符号;
产生第一更新目标信号,从而从所述第一目标信号中除去所述至少一 个脉冲的成分;
至少基于与所述第一更新目标信号相关联的信息来产生第二修改目标 信号;
存储所述至少一个脉冲的至少一个位置和一个符号;
输出所述多个脉冲的所述第二多个脉冲位置和符号。
38.如权利要求26所述的方法,其中所述第一目标信号位于语音域、 经加权的语音域、激励域或者经滤波的激励域中。

说明书全文

技术领域

发明总地涉及电信技术。更具体而言,本发明提供了用于快速映射 码激励线性预测(CELP)模型参数的方法和装置。本发明仅以示例的方 式被应用于从一种CELP编码器/解码器(编解码器)到另一CELP编解码 器的语音转码(transcode),但是将会认识到,本发明具有更广阔的应用 范围。

背景技术

码激励线性预测(CELP)语音编码技术被广泛应用于语音编解码 器。这样的编解码器将语音信号建模为源滤波器模型。源/激励信号经由自 适应和固定码本产生,并且滤波器按照短期线性预测编码器(LPC)来建 模。然后,用一组参数来代表被编码的语音,这组参数指定了滤波器参数 和激励的类型。CELP编解码器的参数包括线谱对(LSP)参数、自适应码 本参数和固定码本参数。
使用CELP技术的工业标准编解码器包括全球移动通信(GSM)增强 型全速率(EFR)编解码器、自适应多速率窄带(AMR-NB)编解码器、 自适应多速率宽带(AMR-WB)、G.723.1、G.729、增强型可变速率编解 码器(EVRC)、可选择模式声码器(SMV)、QCELP和MPEG-4。转码 过程可以将CELP参数从一种语音压缩格式转换成另一种语音压缩格式。 一些转码技术将被压缩的信号完全解码回脉冲编码调制(PCM)表示,然 后再对信号进行重新编码。这些技术通常使用大量的处理,并且招致相当 大的延时。其他转码技术将CELP参数从一种压缩格式转换成另一压缩格 式,同时保持在参数空间中。这些技术通常使用复杂的计算,这种复杂计 算容易发生溢出错误。
因此就期望改善CELP转码技术。

发明内容

本发明总地涉及电信技术。更具体而言,本发明提供了用于码激励线 性预测(CELP)模型参数的快速映射的方法和装置。本发明仅以示例的 方式被应用于从一种CELP编码器/解码器(编解码器)到另一CELP编解 码器的语音转码,但是将会认识到,本发明具有更广阔的应用范围。
根据本发明的实施方式,在语音转码器中用于映射CELP参数的装置 接收作为输入的源编解码器CELP参数以及中间信号,这些中间信号已被 内插为与目的地编解码器的尺寸、子帧尺寸或其他特性相匹配。该装置 包括将内插LSP参数映射为量化LSP参数的LSP映射模、以快速方式 将内插自适应码本参数映射为量化自适应码本参数的自适应码本映射模 块,以及以快速方式将内插固定码本参数映射为量化固定码本参数的自适 应码本映射模块。LSP映射模块检查内插LSP参数在转码信号被设备或系 统所解码时是否可能发生信号溢出,如果预测出信号溢出,则调整LSP参 数,并且量化LSP参数。自适应码本映射模块产生自适应码本目标信号, 从自适应码本中产生用于一个或多个候选基音延迟值的自适应码本候选矢 量信号,计算自适应码本目标信号和候选信号之间的一组简化的自相关和 互相关点积项,并且搜索简化的增益矢量量化码本中的一个或多个条目, 以找到能够提供自相关和互相关点积项的矢量中的最大点积的条目。固定 码本映射模块产生固定码本信号,处理固定码本信号以创建经修改的目标 信号,执行非常快速的脉冲搜索以找到用于估计固定码本增益的初始脉冲 位置和符号,使用快速脉冲位置搜索技术再次搜索代数码本,构建固定码 矢,并且输出固定码本索引。
根据本发明的另一实施方式,用于在语音转码器中映射CELP参数的 方法包括将内插LSP参数映射为量化LSP参数、将内插自适应码本参数映 射为量化自适应码本参数,以及将内插固定码本参数映射为量化固定码本 参数。
根据本发明的又一实施方式,提供了用于为自适应码本映射构建简化 的基音增益码本的方法。该方法包括分组增益点积项以及减小基音增益码 本的尺寸。
根据本发明的又一实施方式,用于固定代数码本的快速脉冲位置搜索 的方法包括选择将搜索的下一音轨,确定(locate)一个或多个脉冲的位 置,从目标中减去当前音轨中脉冲的成分并且处理用于搜索剩余脉冲的目 标信号。
根据本发明的又一实施方式,用于在源编解码器和目的地编解码器之 间映射CELP参数的装置包括LSP映射模块、耦合到LSP映射模块的自适 应码本映射模块,以及耦合到LSP映射模块和自适应码本映射模块的固定 码本映射模块。所述LSP映射模块包括:LP溢出模块,该模块被配置为 处理与多个内插LSP参数相关联的信息,并且至少基于与多个内插LSP参 数相关联的信息来产生溢出信号。另外,LSP映射模块包括LSP参数修改 模块,该模块被配置为响应于溢出信号,来修改多个内插LSP参数中的至 少一个内插LSP参数的至少一个频率。所述自适应码本映射模块包括第一 基音增益码本。该第一基音增益码本包括第一多个条目,所述第一多个条 目中的每一个条目都包括多个项以及与所述多个项相关联的多个和。所述 固定码本映射模块包括第一目标处理模块,该模块被配置为处理第一目标 信号并且产生第一修改目标信号。另外,所述固定码本映射模块包括脉冲 搜索模块,该模块被配置为至少基于与第一修改目标信号相关联的信息, 来确定子帧中多个脉冲的第一多个脉冲位置和符号。此外,所述固定码本 映射模块包括固定码本增益估计模块,该模块被配置为至少基于与第一多 个脉冲位置和符号相关联的信息来估计所述子帧的固定码本增益。所述固 定码本映射模块还包括脉冲位置搜索模块,该模块被配置为接收第一修改 目标信号、冲激响应信号和已估计的固定码本增益,并且输出所述多个脉 冲的第二多个脉冲位置和符号。
根据本发明的又一实施方式,用于在源编解码器和目的地编解码器之 间映射LSP参数的装置包括LP溢出模块,该模块被配置为处理与多个内 插LSP参数相关联的信息,并且至少基于与所述多个内插LSP参数相关联 的信息来产生溢出信号。另外,该装置包括LSP参数修改模块,该模块被 配置为响应于所述溢出信号,来修改所述多个内插LSP参数中的至少一个 内插LSP参数的至少一个频率。此外,该装置包括LSP量化模块,该模块 被配置为至少基于与目的地编解码器所涉及的多个量化表相关联的信息, 来量化所述多个内插LSP参数。该装置还包括LSP解码器及稳定性检查模 块,该模块被配置为对已量化的多个内插LSP参数进行解码。
根据本发明的又一实施方式,用于在源编解码器和目的地编解码器之 间映射自适应码本的装置包括被配置为产生目标信号的自适应码本目标产 生模块以及基音增益码本。该基音增益码本包括多个条目。所述多个条目 中的每个条目都包括多个项和与所述多个项相关联的多个和。此外,该装 置包括候选延迟选择模块,该模块被配置为接收开环基音延迟,并且产生 候选基音延迟值。该装置还包括候选矢量信号产生模块,该模块被配置为 至少基于与所述自适应码本和所述候选基音延迟值相关联的信息,来产生 多个候选信号。此外,该装置包括自相关和互相关模块,该模块被配置为 计算所述目标信号和所述多个候选信号的延迟版本之间或者所述多个候选 信号的所述延迟版本之间的一组点积,并且输出至少与这组点积相关联的 矢量信号。此外,该装置包括增益码矢选择模块,该模块被配置为接收矢 量信号,从而估计与第一基音增益码本相关联的条目和接收到的矢量信号 之间的点积,至少处理与所述点积以及预定值相关联的信息,并且输出被 选码矢的索引和与被选码矢相关联的自适应码本基音延迟。该装置还包括 缓冲区模块,该模块用于存储所述被选码矢的索引以及所述自适应码本基 音延迟。
根据本发明的又一实施方式,用于在源编解码器和目的地编解码器之 间映射固定码本的装置包括固定码本目标产生模块,该模块被配置为产生 目标信号,以及目标处理模块,该模块被配置为处理目标信号和产生第一 修改目标信号。另外,该装置包括脉冲搜索模块,该模块被配置为至少基 于与所述第一修改目标信号相关联的信息,来确定子帧中多个脉冲的第一 多个脉冲位置和符号。此外,该装置包括固定码本增益估计模块,该模块 被配置为至少基于与所述第一多个脉冲位置和符号相关联的信息来估计所 述子帧的固定码本增益。该装置还包括脉冲位置搜索模块,该模块被配置 为接收所述第一修改目标信号、冲激响应信号和已估计的固定码本增益, 并且输出所述多个脉冲的第二多个脉冲位置和符号。另外,该装置包括码 矢构建模块,该模块被配置为接收所述第二多个脉冲位置和符号,从而产 生固定码本矢量,并且确定用于所述子帧的固定码本索引。
根据本发明的又一实施方式,用于在源编解码器和目的地编解码器之 间映射CELP参数的方法包括:接收多个内插LSP参数、多个内插自适应 码本参数和多个内插固定码本参数。另外,该方法包括至少基于与多个内 插LSP参数相关联的信息来产生多个量化LSP参数,至少基于与多个内插 自适应码本参数相关联的信息来产生多个量化自适应码本参数,以及至少 基于与多个内插固定码本参数相关联的信息来产生多个量化固定码本参 数。所述产生多个量化LSP参数的步骤包括至少基于与所述多个内插LSP 参数相关联的信息来产生溢出信号。所述产生多个量化自适应码本参数的 步骤包括估计与基音增益码本相关联的条目和矢量信号之间的点积。所述 基音增益码本包括多个条目。所述多个条目中的每个条目都包括多个项以 及与所述多个项相关联的多个和。所述产生多个量化固定码本参数的步骤 包括至少基于与第一目标信号相关联的信息来产生第一修改目标信号、至 少基于与第一修改目标信号相关联的信息来确定子帧中多个脉冲的第一多 个脉冲位置和符号、至少基于与第一多个脉冲位置和符号相关联的信息来 估计所述子帧的固定码本增益,以及至少基于与第一修改目标信号、冲激 响应信号和估计出的固定码本增益来产生多个脉冲的第二多个脉冲位置和 符号。
使用本发明可以获得比其他技术更多的优势。本发明的某些实施方式 提供了用于快速LSP映射、快速自适应码本映射和快速固定码本映射的装 置和方法。该装置和方法可以调整被映射的线性预测参数,以防止目的地 编解码器的解码器中的信号溢出。本发明的某些实施方式可以减少计算量 以及计算复杂性的复杂度。例如,减少用于测试候选码矢的计算,或者减 少用于产生基音增益码本中的条目的计算。在本发明的某些实施方式中, 还减少了所需存储器的量。例如,简化的基音增益码本的每个码矢条目中 包含更少的元素。在本发明的某些实施方式中,自相关和互相关计算单元 以与简化的基音增益码本中的条目中的项相匹配的格式输出长度被缩短的 点积元素矢量。在某些实施方式中,由于基音增益码本的简化,计算出的 相关点积数目的减小,计算出的残差信号数目的减少以及计算出的延时加 权合成信号数目的减少,因此本发明的自适应码本搜索的复杂度要低于其 他自适应码本搜索的复杂度。
依赖于论述中的实施方式,可以实现这些优势中的一个或多个。参考 以下的详细描述和附图可以全面了解本发明的这些优势和各种其他的目 的、特征和优点。

附图说明

图1是用在两种基于CELP的语音编解码器之间的转码器的简图;
图2是根据本发明一种实施方式的CELP参数映射模块的简图;
图3是根据本发明一种实施方式的快速LSP映射模块的简图;
图4是根据本发明一种实施方式的快速LSP映射的方法的简图;
图5是根据本发明一种实施方式的用于10阶稳态LP分析滤波器的 LSP参数的简图;
图6是可能在目的地编解码器中产生非稳态LP滤波器或者导致信号 溢出的LSP参数的简图;
图7是N抽头基音预测滤波器的简图;
图8示出了用于确定CELP编解码器中的自适应码本参数的误差最小 化过程的简图;
图9是用于确定基于CELP的语音编解码器中的基音参数的程序的简 图;
图10是根据本发明一种实施方式的快速自适应码本映射模块的简 图;
图10A是根据本发明一种实施方式的快速自适应码本映射模块的另一 简图;
图11是根据本发明一种实施方式的用于利用快速自适应码本搜索来 确定基音参数的方法的简图;
图12是根据本发明一种实施方式将一个自适应码本与另一自适应码 本进行比较的简图;
图13是用于执行CELP编解码器中的代数码本搜索的装置的简化框 图;
图14是根据本发明一种实施方式的快速固定码本映射模块的简图;
图15是根据本发明一种实施方式的快速脉冲位置搜索模块的简图;
图16是根据本发明一种实施方式的快速脉冲位置搜索的简图。

具体实施方式

本发明总地涉及电信技术。更具体而言,本发明提供了用于码激励线 性预测(CELP)模型参数的快速映射的方法和装置。本发明仅以示例的 方式被应用于从一种CELP编码器/解码器(编解码器)到另一CELP编解 码器的语音转码,但是将会认识到,本发明具有更广阔的应用范围。
图1是用在两种基于CELP的语音编解码器之间的转码器的简图。参 见美国申请序列号No.10/339,790以及公布No.US2003/0177004,这里为 所有目的并入其内容以作为参考。该转码器包括源编解码器拆包模块 110、CELP参数内插模块120、CELP参数映射模块130和目的地编解码 器打包模块140。CELP参数内插模块120内插CELP参数,以匹配目的 地编解码器的帧长和子帧长,并且利用CELP参数映射模块130对所产生 的内插CELP参数进行映射以形成目的地编解码器参数。目的地编解码器 打包模块140将所述参数打包为具有所需格式的比特流。
图2是根据本发明一种实施方式的CELP参数映射模块的简图。该图 仅仅是一个实施例,该实施例不应不适当地限制本发明的范围。本领域普 通技术人员将会想到很多变化、替代和修改。CELP参数映射模块200包 括LSP映射模块210、自适应码本映射模块220和固定码本映射模块 230。虽然已经使用各种模块示出了上述CELP参数映射模块,但是可以 存在很多替代、修改和变化。例如,这些模块中的一些可以被扩展和/或 组合。可以将其他模块插入到上述这些模块中。可以根据所述实施方式来 替换具体的模块。在整个说明书中,可以找到这些模块的更多详细内容。
在一个实施例中,快速映射技术被应用于这些模块中的每一个模块, 以便在不降低信号质量的情况下,减少用于映射的计算需求。这些技术包 括用于自适应码本映射和固定码本映射的快速处理。另外,这些技术包括 用于防止由于来自源到目的地(source-to-destination)编解码器的LSP参 数的快速映射而引起的信号溢出。这些技术可被一起使用,或者与其他参 数映射技术结合使用。例如,CELP参数映射模块200被用作CELP参数 映射模块130。
在从一种基于线性预测的语音编解码器到另一基于线性预测的语音编 解码器的有效率的转码过程中,经常使用对来自源到目的地编解码器的线 谱对(LSP)参数的内插。这消除了重新计算线性预测(LP)参数的需 要。由于不同的编解码器可以使用不同的帧长、子帧长、超前延迟、预测 阶数、带宽扩展或LP分析窗类型,因此来自一个编解码器的LSP参数可 能不适合于另一编解码器。在某些情况下,来自一个编解码器的已解码 LSP参数会由于不匹配的LP分析而导致质量衰退,甚至导致信号溢出, 所述已解码LSP参数被内插,并用于重建第二编解码器中的语音。
通过沿着单位圆周进行搜索并且对过零点内插,将LP系数转换为 LSP系数。可以利用下列关系将LSP转换为在范围[0,fs/2]中的以Hz为单 位的线谱频率(LSF):
LSF j = f s 2 π arccos ( LSP j ) j = 0 , . . . , N (等式1)
其中fs是采样频率,并且N是预测阶数。在频率上彼此靠近的LSF 会导致LP滤波器中的强烈共振,这种强烈共振会导致信号溢出。在很多 基于CELP的语音编解码器中,执行检查来测试LP滤波器的稳定性。这 样可以确保LSF被适当地排列,并且在邻近的LSF之间存在最小距离 Δmin。典型的滤波器稳定标准是:
LSFj+1-LSFj≥Δmin    1≤j≤N-1    (等式2)
但是,在从一个编解码器到另一个编解码器的转码过程中,即使两个 编解码器的稳定标准都得到满足,也可能发生信号溢出。当使用语音解码 器的定点实现时,这是很明显的。
例如,在GSM-AMR到G.723.1的转码器中,LSF被线性内插,以补 偿GSM-AMR的20ms帧尺寸与G.723.1的30ms帧尺寸。然后利用 G.723.1对内插后的LSF进行量化,并将其输出到比特流。但是,当利用 G.723.1标准定点实现的解码器对LSF进行解码时,即使满足GSM-AMR 和G.723.1两者的稳定标准,不匹配的LP分析也会导致G.723.1解码器中 LSP到线性预测系数(LPC)转换中的中间变量溢出。在转码期间需要采 取预防措施,以避免解码器中的信号溢出。
图3是根据本发明一种实施方式的快速LSP映射模块的简图。该图仅 仅是一个实施例,该实施例不应不适当地限制本发明的范围。本领域普通 技术人员将会想到很多变化、替代和修改。快速LSP映射模块300包括 LP溢出预测模块310、LSP参数修改模块320、LSP量化模块330和LSP 解码器及稳定性检查模块340。虽然已经使用各种模块示出了上述快速 LSP映射模块,但是可以存在很多替代、修改和变化。例如,这些模块中 的一些可以被扩展和/或组合。可以将其他模块插入到上述这些模块中。 可以根据所述实施方式来替换具体的模块。在整个说明书中,可以找到这 些模块的更多详细内容。
快速LSP映射模块300执行从源到目的地编解码器内插后的LSP参 数到目的地编解码器量化后的LSP参数的转换。另外,模块300可以检测 可能的解码器溢出情况,并且通过LSF调整来避免由内插后的LSF所引 起的这种信号溢出。
图4是根据本发明一种实施方式的快速LSP映射的方法的简图。该图 仅仅是一个实施例,该实施例不应不适当地限制本发明的范围。本领域普 通技术人员将会想到很多变化、替代和修改。如图4所示,快速LSP映射 的方法400包括过程410、420、430、440、450、460、470和480。虽然 已经使用所选的过程序列示出了上述快速LSP映射的方法,但是可以存 在很多替代、修改和变化。例如,这些过程中的一些可以被扩展和/或组 合。可以将其他过程插入到上述这些过程中。可以根据所述实施方式来交 换具体的步骤顺序。方法400可以由快速LSP映射模块300来执行。另 外,方法400可以调整LSF的频率以避免信号溢出,并且不会对语音质量 产生重大影响。在整个说明书中,可以找到这些过程的更多详细内容。
如图3和4所示,内插后的LSP参数350被输入到LP溢出预测模块 310中,该模块310检查解码器中可能的LP溢出问题。如果预测出信号 溢出,则在LSP参数修改模块320中修改LSF。该修改可以利用各种方法 来执行。例如,在过程410和420处,LP溢出预测模块310将内插后的 LSP用作输入,并且以如下方式计算前K个LSP的数量和E1,以及后K 个LSP的数量和E2:
E 1 = Σ i = 1 K | LSP ( i ) | (等式3)
E 2 = Σ i = M - K - 1 M - 1 | LSP ( i ) | (等式4)
其中, K M 2 并且M是预测阶数。K是正整数。
在过程430和440处,分别将E1与Thr1进行比较,将E2与Thr2进 行比较。如果E1>Thr1或E2>Thr2(其中Thr1和Thr2是预定阈值),则 预测在解码器中将发生信号溢出,并且随后在过程450处,在LSP参数修 改模块320中修改LSP。如果E1>Thr1,则提高内插后的LSP中的至少一 个LSP的至少一个频率。如果E2>Thr2,则降低内插后的LSP中的至少一 个LSP的至少一个频率。
然后在过程460处,由LPS量化模块330使用目的地编解码器的量化 表和方法对LSP参数进行量化。在过程470和480处,由LSP解码器及 稳定性检查模块340对量化后的LSP参数进行解码,并且执行稳定性检 查。稳定性检查通常可以确保相邻LSP之间的正确排序和最小频率间 隔。在转码器内的进一步处理中,要使用被解码的目的地编解码器LSP 参数。例如,快速LSP映射模块300被用作快速LSP映射模块210。
10阶线性预测滤波器一般被用在使用8kHz采样频率的语音编解码器 中。图5是根据本发明一种实施方式的用于10阶稳态LP分析滤波器的 LSP参数的简图。该图仅仅是一个实施例,该实施例不应不适当地限制本 发明的范围。本领域普通技术人员将会想到很多变化、替代和修改。每个 方框的垂直分量是落在-1<LSPi<+1范围内的LSP值,并且平分量是 落在0<LSPi<π范围内的归一化LSF值。
图6是可以在目的地编解码器中产生非稳态LP滤波器或者导致信号 溢出的LSP参数的简图。前五个LSP参数具有紧密间隔的LSF值,并且 具有靠近1的LSP值。虽然这些LSP参数满足相邻LSF之间的最小距离 为31.25Hz的标准,但是会在标准解码器中导致信号溢出。相比之下,根 据本发明的一种实施方式,LSP参数修改不仅避免了由来自具有不同LP 分析参数的编解码器的内插后LSP所引起的信号溢出,而且保持了语音 质量。如图5所示,对于10阶预测滤波器,由于前三个LSP参数会影响 感官上重要的第一共振峰频率的位置,因此避免修改前三个LSP参数, 否则会降低信号质量。因此,当前四个LSP的平均值超过0.91时,该修 改分别利用f4Hz、f5Hz和f6Hz来提高第4、第5和第6个LSF的频率。 可以对LSF应用不同的阈值、频移和修改以降低解码器模块中的信号溢 出的可能性。
本发明的某些实施方式还提供了用于在语音转码中执行快速自适应码 本映射技术的方法和装置。在诸如ITU-T建议G.723.1的一些基于CELP 的语音编解码器中,使用多抽头基音预测滤波器。由于多抽头基音预测器 的频率响应可以在多个整数延迟(lag)之间进行内插,因此它可以获得 比单抽头预测器更高的预测增益。
图7是N抽头基音预测滤波器的简图。多抽头滤波器的传输函数如 下:
T ( z ) = Σ j = 0 N - 1 β j z - ( L + j ) (等式5)
其中,j是基音预测器的系数,N是滤波器抽头数目,并且L是基音 延迟。在CELP编码中,产生目标信号s(n),该目标信号可以位于语音 域、激励域或者经滤波的激励域中。在激励域中消除短期线性预测成分。 对于长度为lsf的子帧,在目标信号s(n)和基音预测成分之间的误差信号如 下:
e ( n ) = s ( n ) - Σ j = 0 N - 1 β j s ( n - L - N 2 + j ) , n = 0,1 , . . . , l sf (等式6)
其中s′(n)可以是目标信号的延时版本,或者通过利用加权的冲激响应 对自适应码本信号或过去的激励信号进行滤波来获得。均方误差可以被写 作:
ϵ = e T e = Σ n = 0 l sf [ s ( n ) - β 0 s ( n - L - N 2 ) - β 1 s ( n - L - N 2 + 1 ) - . . . - β N - 1 s ( n - L + N 2 ) ] 2 (等式7)
进一步展开上述等式,我们可以得到:
ϵ = R ss ( 0,0 ) - [ Σ i = 0 N - 1 β i R SS ( 0 , i ) - 2 Σ i = 0 N - 1 β i 2 R S S ( i , j ) - 2 Σ i = 1 N - 1 Σ j = 0 i - 1 β i β j R S S ( i , j ) (等式8)
其中,Rss(x,y)、Rss′(x,y)、Rs′s′(x,y)是如下的自相关和互相关点积项:
R ss ( 0,0 ) = Σ n = 0 l sf - 1 s ( n ) 2 (等式9)
R ss ( 0 , i ) = Σ n = 0 l sf - 1 s ( n ) s ( n - L - N 2 + i ) (等式10)
R s s ( i , j ) = Σ n = 0 l sf - 1 s ( n - L - N 2 + i ) s ( n - L - N 2 + j ) (等式11)
图8示出了用于确定CELP编解码器中的自适应码本参数的误差最小 化过程的简图。为了确定最优的基音参数,要使均方误差最小化。这包括 找到使等式8的第二项产生最大值的最佳增益系数β={β0,β1,...,βN-1},以 及相关联的基音延迟L。虽然基音预测器的阶数越高,获得的性能越好, 但是需要计算的Rs′s(i,j)项的数目呈指数增长。为了减轻计算负担,通常预 先计算增益乘积项βiβj,并且将其存储在增益码本中。对于5抽头滤波 器,需要15个附加的增益乘积项。因此每个码本矢量包含20个元素,这 20个元素是每个抽头的增益系数以及预先计算的增益系数的乘积,这20 个元素如下:
首先5个元素: β0       β1       β2        β3       β4
其次5个元素: -β0 2     -β1 2     -β2 2     -β3 2     -β4 2
最后10个元素:-β0β1  -β0β2  -β1β2  -β0β3  -β1β3
              -β2β3  -β0β4  -β1β4  -β2β4  -β3β4
图9是用于确定基于CELP的语音编解码器中的基音参数的程序的简 图。对于特定延迟值,计算出的Rss矢量包含CL个自相关和互相关点积 项。通过利用索引k的Rss矢量和增益矢量的点积计算来评价等式8的第 二项。对于给定范围内的所有码本索引以及给定范围内的所有延迟值,重 复该计算,并且存储产生点积结果最大值的索引kbest和延迟值lagbest。
如图9所示,自适应码本映射模块900包括增益码本910、增益码矢 选择模块920、获取候选延迟模块930、自适应码本940、获取候选矢量模 块950、自相关和互相关模块960以及缓冲区模块980。自相关和互相关 模块960输出Rss矢量970。
在本发明的某些实施方式中,降低了用于在编码基音参数期间使预测 误差最小化所需的复杂性。该方法可应用于如下的语音编码器,该语音编 码器使用多抽头基音滤波器以及增益系数和预先计算的增益乘积项的码 本。该方法包括将相似的Rs′s(i,j)项分组。在具体实施方式中,将具有公共 延迟差的自相关点积项分组在一起。例如,如果基音预测器具有5个抽 头,那么Rs′s(i,j)项可以被如下分组:
组1:Rs′s(0,0),Rs′s(1,1),Rs′s(2,2),Rs′s(3,3),Rs′s(4,4)
组2:Rs′s(0,1),Rs′s(1,2),Rs′s(2,3),Rs′s(3,4)
组3:Rs′s(0,2),Rs′s(1,3),Rs′s(2,4)
组4:Rs′s(0,3),Rs′s(1,4)
组5:Rs′s(0,4),
这种排列将具有相似延迟差的元素的自相关点积分组在一起。在其他 具体实施方式中,可以假设同一组内的Rs′s(i,j)项大致相等。因此,只需要 计算5项,而不是计算15个Rs′s(i,j)项。因此,Rss矢量将只包含10项。
图10是根据本发明一种实施方式的快速自适应码本映射模块的简 图。该图仅仅是一个实施例,该实施例不应不适当地限制本发明的范围。 本领域普通技术人员将会想到很多变化、替代和修改。快速自适应码本映 射模块1000包括增益码本1010、增益码矢选择模块1020、获取候选延迟 模块1030、自适应码本1040、获取候选矢量模块1050、自相关和互相关 模块1060以及缓冲区模块1080。虽然已经使用各种模块示出了上述快速 自适应码本映射模块,但是可以存在很多替代、修改和变化。例如,这些 模块中的一些可以被扩展和/或组合。可以将其他模块插入到上述这些模块 中。可以根据所述实施方式来替换具体的模块。在整个说明书中,可以找 到这些模块的更多详细内容。
如上所述,如图10所示的简化增益码本1010的每个码矢中的元素数 目CL′小于如图9所示的标准增益码本910的每个码矢中的元素数目CL。 在一个实施例中,快速自适应码本映射模块1000被用作快速自适应码本 映射模块220。
图10A是根据本发明一种实施方式的快速自适应码本映射模块的另一 简图。该图仅仅是一个实施例,该实施例不应不适当地限制本发明的范 围。本领域普通技术人员将会想到很多变化、替代和修改。快速自适应码 本映射模块1090包括简化增益码本1091、增益码矢选择模块1092、候选 延迟选择模块1093、自适应码本1094、候选矢量产生模块1095、自相关 和互相关模块1096、缓冲区模块1098以及自适应码本目标产生模块 1099。快速自适应码本映射模块1090可以与快速自适应码本映射模块 1000相同或不同。虽然已经使用各种模块示出了上述快速自适应码本映射 模块,但是可以存在很多替代、修改和变化。例如,这些模块中的一些可 以被扩展和/或组合。可以将其他模块插入到上述这些模块中。可以根据所 述实施方式来替换具体的模块。在整个说明书中,可以找到这些模块的更 多详细内容。
自适应码本1094存储了多个激励信号。候选延迟选择模块1093接收 开环基音延迟,并且产生候选基音延迟值。至少基于与自适应码本1094 和候选基音延迟值相关联的信息,候选矢量信号产生模块1095输出多个 候选信号。例如,多个候选信号与残差(residual)域目标信号相关联,并 且没有经过合成。自适应码本目标产生模块1099产生自适应码本目标信 号。例如,自适应码本目标信号处于语音域、经加权的语音域、激励域或 者经滤波的激励域中。自相关和互相关模块1096执行一组简化的点积, 并且产生Rss矢量1097。在一个实施例中,Rss矢量1097与Rss矢量1070 相同。Rss矢量1097被传递到增益码矢选择模块1092,该模块1092搜索 增益码本1091的至少一个索引,以找到最佳增益码矢的索引kbest。产生该 Rss值的候选基音延迟值是lagbest。kbest和lagbest与增益码本1091中的条目 以及由候选延迟选择模块1093得到的候选延迟相关联,其能够提供自相 关和互相关点积项的矢量中的最大点积。
图11是根据本发明一种实施方式的用于利用快速自适应码本搜索来 确定基音参数的方法的简图。该图仅仅是一个实施例,该实施例不应不适 当地限制本发明的范围。本领域普通技术人员将会想到很多变化、替代和 修改。用于确定基音参数的方法1100包括用于获取开环基音(OLP)的过 程1110、用于获取OLP范围内的候选延迟Lc的过程1120、用于以延迟Lc 从自适应码本中获取候选矢量的过程1130、用于计算候选矢量的自相关点 积的过程1140、用于计算目标和候选矢量之间的互相关点积的过程 1150、用于构建Rss矢量的过程1160、用于从简化的增益码本中选出最佳 增益码矢的过程1170、用于将最佳码本索引kbest和最好延迟lagbest存储在 缓冲区中的过程1172、用于判断是否搜索了有限的基音范围的过程1180 以及用于输出最佳码本索引和最佳延迟值比特流的过程1190。虽然已经使 用所选的过程序列示出了上述方法,但是可以存在很多替代、修改和变 化。例如,这些过程中的一些可以被扩展和/或组合。可以将其他过程插入 到上述这些过程中。可以根据实施方式来交换具体的步骤顺序。在整个说 明书中,可以找到这些过程的更多详细内容。
对于基音增益码本的存储需求以及用于测试每个候选码本矢量所需的 乘法次数被减少了 并且点积项的数目和需要计算的合成残差信号的 数目被减少了 在一个实施例中,由快速自适应码本映射模块1000 来实现用于确定基音参数的方法1100。
图12是根据本发明一种实施方式将一个自适应码本与另一自适应码 本进行比较的简图。该图仅仅是一个实施例,该实施例不应不适当地限制 本发明的范围。本领域普通技术人员将会想到很多变化、替代和修改。如 图12所示,基音增益码本1210可被用于GSM自适应多速率(AMR)编 解码器和G.723.1双速率语音编解码器之间的转码器。G.723.1使用5抽头 基音预测滤波器。对于子帧0和2,闭环基音延迟是以±1个抽样的距离而 从适当的开环基音延迟中选出的。对于子帧1和3,其基音延迟可以只与 在前子帧的延迟相差-1、0、+1或+2个抽样。基音预测器增益是依赖于比 特率和延迟值而使用85条目的码本或170条目的码本进行量化的矢量。 每个码本条目都是具有预先计算的增益系数项的20元素矢量,并且被排 列如下:
首先5个元素: β0       β1       β2        β3       β4
其次5个元素: -β0 2     -β1 2     -β2 2      -β3 2    -β4 2
最后10个元素:-β0β1  -β0β2  -β1β2  -β0β3  -β1β3
              -β2β3  -β0β4  -β1β4  -β2β4  -β3β4
根据本发明的一种实施方式,如图2中的85条目的基音增益码本 1220所示,基音增益码本1210被重建为使得每个条目只具有10个元素。 对于170条目的基音增益码本,也可以执行这种重建。例如,在基音增益 码本1210中的多个条目与目的地编解码器中的另一基音增益码本中的另 外多个条目相关。
对于基音增益码本1210中的每个条目,其后5个元素通过对基音增 益码本1210中的适当项求和来计算。所产生的简化基音增益码本1220具 有如下格式:
前5个元素:β0      β1        β2         β3        β4
后5个元素:        β0β4
这种近似和简化使得用于基音增益码本的存储器存储需求减半,使得 用于测试每个候选码本所需的乘法和加法次数减半,并且将Rs′s(i,j)点积项 的数目和需要计算的合成残差信号的数目减少了3倍。
在快速自适应码本搜索期间,使以下等式最大化:
max Σ j = 0 P - 1 C i · R SS ( 0 , i ) - C 5 · R S S ( 2,2 ) - 2 C 6 · R S S ( 0,1 ) - 2 C 7 · R S S ( 0,2 ) - 2 C 8 · R S S ( 0,3 ) - 2 C 9 R S S ( 0,4 ) (等式12)
其中Ci是简化增益码本中的一个条目的第i个元素。选出Rs′s(i,j)项来 代表其各自的组,并且Rs′s(i,j)项可以用同一组中的另一自相关点积项来代 替。
本发明的某些实施方式还提供了用于语音转码器中的快速固定码本映 射技术的方法和装置。一些CELP语音编码算法使用代数结构的固定码本 来降低所需存储器的存储量。代数码矢是稀疏的,并且在某些位置上具有 其振幅为±1的脉冲。在不同编码算法之间,用于码矢的脉冲数目和候选脉 冲位置有所不同。
例如,在用于GSM-AMR 12.2kbps和10.2kbps模式的表1和2中分 别示出了子帧中的每个脉冲的可能脉冲位置。   音轨   脉冲              位置   0   i0,i5   0,5,10,15,20,25,30,35   1   i1,i6   1,6,11,16,21,26,31,36   2   i2,i7   2,7,12,17,22,27,32,37   3   i3,i8   3,8,13,18,23,28,33,38   4   i4,i9   4,9,14,19,24,29,34,39
                        表1   音轨   脉冲                   位置   0   i0,i4   0,4,8,12,16,20,24,28,32,36   1   i1,i5   1,5,9,13,17,21,25,29,33,37   2   i2,i6   2,6,10,14,18,22,26,30,34,38   3   i3,i7   3,7,11,15,19,23,27,31,35,39
                           表2
在这些情况下,音轨(track)是相互交织的,并且不共享公共的脉冲 位置。如表1所示,对于12.2kbps模式,在具有40个抽样的子帧内存在 5条音轨,并且在每条音轨中具有8个可能的脉冲位置。码矢具有10个脉 冲,在每条音轨中存在2个脉冲。如图2所示,对于10.2kbps模式,在具 有40个抽样的子帧内存在4条音轨,并且每条音轨允许具有2个脉冲。
图13是用于执行CELP编解码器中的代数码本搜索的装置的简化框 图。例如,该装置用于寻找固定码本中的码矢ck,该码矢ck可以最佳地匹 配目标信号。目标信号x2(n)是通过从加权的输入语音信号中减去自适应码 本成分而产生的。通过使以下项最大化来搜索代数码本:
T k = E xy E yy = ( d t c k ) 2 c k Φ c k (等式13)
其中d=Htx2是目标信号和加权合成滤波器的冲激响应h(n)之间的相 关,H=hTh是下三Toeplitz矩阵,该矩阵具有对角线h(0)和下对角线 h(1),...,h(39),ck是具有索引k的码矢,并且Φ=HTH是h(n)的自相关矩 阵。通常利用Tk的计算次数或者被测试的候选码本的数目来测量计算负 担。全部ACELP搜索具有很高的计算需求,并且搜索的复杂度可以通过 测试更少量候选码本来降低。每个码矢中的不同代数结构和脉冲数目会依 赖于不同的标准,以及每个标准中用于降低复杂度的搜索方法而有所不 同。例如,G.729使用集中搜索,并且在8192个候选码本中测试1440个 候选码本。GSM-AMR在将第一脉冲固定在局部最大之后,使用深度优先 树搜索,并且用于最高模式测试的候选码本数目是1024。即使利用这些快 速方法,计算复杂度也仍旧很大,并且高达转码器的总计算复杂度的 40%。
图14是根据本发明一种实施方式的快速固定码本映射模块的简图。 该图仅仅是一个实施例,该实施例不应不适当地限制本发明的范围。本领 域普通技术人员将会想到很多变化、替代和修改。快速固定码本映射模块 1400包括目标处理模块1410、快速脉冲搜索模块1420、固定码本 (FCB)增益估计模块1430、快速脉冲位置搜索模块1440和码矢构建模 块1450。虽然已经使用各种模块示出了上述快速固定码本映射模块,但是 可以存在很多替代、修改和变化。例如,这些模块中的一些可以被扩展和/ 或组合。可以将其他模块插入到上述这些模块中。可以根据所述实施方式 来替换具体的模块。在整个说明书中,可以找到这些模块的更多详细内 容。
在一个实施例中,模块1400对目标信号的每个子帧执行快速固定码 本映射。在另一实施例中,快速固定码本映射模块1400被用作快速固定 码本映射模块230。例如,快速固定码本映射模块1400与固定码本相关 联,固定码本是代数固定码本或多脉冲固定码本。在另一实施例中,快速 固定码本映射模块1400与包括稀疏固定码本的目的地编解码器相关联。
固定码本目标信号1460,即x2(n)可以由固定码本目标产生模块产 生。例如,目标信号1460位于语音域、经加权的语音域、激励域或经滤 波的激励域中。信号1460与LP滤波器的冲激响应信号1462,即h(n)相 关,从而以如下方式在目标处理模块1410中形成经修改的目标信号 1464,即A(n):
A(n)=∑x2(j)·h(j+n),n=0,....,lsf    (等式14)
然后,快速脉冲搜索模块1420采用经修改的目标信号1464,即 A(n),并且将码矢中所需的所有Np个脉冲的位置都设置在相关码本音轨的 Pt个最高位置上,其中Pt是在音轨t中允许的非零脉冲的数目。脉冲的符 号被设置为在脉冲位置上的A(n)的符号。然后,FCB增益估计模块1430 使用这些脉冲位置的初始值1466和符号来形成固定码本增益的估计gest。 然后,固定码本增益估计1468、经修改的目标信号1464和冲激响应信号 1470被用在快速脉冲位置搜索模块1440中,该模块1440用于确定最终的 脉冲位置和符号1472。冲激脉冲信号1470可以与冲激脉冲信号1462相同 或不同。最后,由码矢构建模块1450来构建用于固定码字矢量和固定码 本索引的信号1474。信号1474被输出为比特流。
图15是根据本发明一种实施方式的快速脉冲位置搜索模块的简图。 该图仅仅是一个实施例,该实施例不应不适当地限制本发明的范围。本领 域普通技术人员将会想到很多变化、替代和修改。速脉冲位置搜索模块 1500包括音轨选择模块1510、单个音轨脉冲搜索模块1520、目标更新模 块1530、目标处理模块1540以及缓冲区模块1580。例如,快速脉冲位置 搜索模块1500被用作快速脉冲位置搜索模块1440。虽然已经使用各种模 块示出了上述快速脉冲位置搜索模块,但是可以存在很多替代、修改和变 化。例如,这些模块中的一些可以被扩展和/或组合。可以将其他模块插入 到上述这些模块中。可以根据所述实施方式来替换具体的模块。在整个说 明书中,可以找到这些模块的更多详细内容。
音轨选择模块1510是可选的,并且可以被调谐,从而以特定顺序来 搜索脉冲或音轨。例如,可能希望根据最高振幅抽样或最高能量优先来设 置音轨中的脉冲。单个音轨脉冲搜索模块1520将经修改的目标信号1550 (即A(n)和音轨号t用作输入,所述音轨号t用于确定子帧中的候选脉 冲位置,并且定位Pt个最大抽样的位置。目标更新模块1530通过将当前 音轨中的Pt个脉冲与冲激响应信号1560,即h(n)做卷积,并且使用gest调 整增益,来确定当前音轨中的Pt个脉冲的语音域成分。由于在ACELP 中,脉冲是具有振幅+1或-1的简单冲激脉冲,因此其语音域成分只不过是 位于被选位置处并经过增益调整的Pt个冲激脉冲的和。从固定码本目标信 号1460,即x2(n)中减去该成分。目标处理模块1540通过使该结果与冲激 响应信号1560进行相关运算来产生另一经修改的目标信号1570。经修改 的目标信号1570可以被用作音轨选择模块1510和单个音轨脉冲搜索模块 1520的输入,以作为经修改的目标信号1550做进一步的处理。缓冲区模 块存储了已经搜索的音轨的位置和符号,并且一旦已经搜索了所有的音 轨,就输出子帧中所有脉冲的位置和符号。
依赖于语音编码标准,可以包括前向和/或后向脉冲增强的影响。
x 2 ( n ) x 2 ( n ) - g est · sign ( k ) Σ k = 0 P t h ( n - p ( k ) ) , n = 0 , . . . , l sf (等式15)
A(n)←∑x2(j)·h(j+n),n=0,....,lsf    (等式16)
由于本发明实施方式的搜索算法在单个音轨中一次搜索Pt个脉冲,因 此如果编解码器的标准允许,则可以对相同位置上的多个脉冲应用已修改 的约束。该算法还可以被修改为在每次叠代中只选择一个脉冲位置,而不 是选择音轨中的所有脉冲。
图16是根据本发明一种实施方式的快速脉冲位置搜索的简图。该图 仅仅是一个实施例,该实施例不应不适当地限制本发明的范围。本领域普 通技术人员将会想到很多变化、替代和修改。用于快速脉冲位置搜索的方 法1600包括用于产生经修改的目标信号的过程1610、用于通过搜索经修 改的目标信号中的峰值来执行快速搜索的过程1620、用于估计固定码本增 益的过程1630、用于选择下一音轨以寻找脉冲的过程1640、用于寻找音 轨中的一个或多个脉冲的位置的过程1650、用于寻找音轨中的一个或多个 脉冲的符号的过程1660、用于将脉冲位置和符号存储在缓冲区中的过程 1670、用于通过减去当前音轨中脉冲的成分来更新目标信号的过程1680、 用于为剩余音轨创建经修改的目标信号的过程1690、用于判断是否已经处 理了所有脉冲或音轨的过程1692以及用于建立码矢的过程1694。在一个 实施例中,用于快速脉冲位置搜索的方法1600是由快速固定码本映射模 块1400来实现。虽然已经使用所选过程序列示出了上述方法,但是可以 存在很多替代、修改和变化。例如,这些过程中的一些可以被扩展和/或组 合。可以将其他过程插入到上述这些过程中。可以根据所述实施方式来交 换具体的步骤顺序。在整个说明书中,可以找到这些过程的更多详细内 容。
作为实施例,快速脉冲位置搜索的方法1600被应用于G.723.1到 GSM-AMR转码器中的GSM-AMR的12.2kbps模式中。使用根据本发明 一种实施方式的搜索程序,对于每个子帧只需要五次相关和四次卷积,来 确定10脉冲码矢的脉冲位置和符号。这五次相关对应于每条音轨中的一 次相关,并且四次卷积对应于除了最后一条音轨之外的每条音轨中的一次 卷积。卷积被简化为卷积中的一个信号,该信号只具有两个非零抽样。该 信号是只包含当前音轨中的脉冲的矢量ctemp(n)。但是,相关发生在具有子 帧长度lsf=40的两个非稀疏矢量之间。这通常需要相当多的乘法/加法运 算。利用之前计算的值以及改变运算顺序的能,可以简化该算法实现方 式。可以使用下述捷径来替代等式14到16中所执行的计算。在A(n)和更 新后的A(n)之间的差是b(n)是经滤波和增益调整后的ctemp(n)与h(n)之间的 相关。
首先,b(n)=gest·∑ctemp,filt(j)·h(j+n),n=0,....,lsf    (等式17)
其中ctemp,filt(n)=∑ctemp(j)·h(n-j),n=0,....,lst        (等式18)
因此可以如下从A(n)中减去b(n)来减少计算:
A(n)←A(n)-b(n),n=0,....,lsf                              (等式19)
为了进一步减小计算的复杂度,等式17可以被重新排列为:
b(n)=gest·∑ctemp(j)·autocorrh(n-j),n=0,....,lst      (等式20)
其中autocorrh(n)=∑h(j)·h(j+n),n=0,....,lsf             (等式21)
h(n)的自相关autocorrh(n)可以在每个子帧开始时预先计算。这样,仅 需要在预先计算的矢量和只具有2个非零脉冲的ctemp(n)之间进行卷积就可 以有效地计算出b(n)。这将计算减少到每个子帧只需一次自相关、一次互 相关和四次利用稀疏矢量ctemp(n)的“卷积”。
在具体实施方式中,如果满足某个标准,就可以将音轨中的两个脉冲 放置在相同的位置上。该标准可以采用多种形式,例如,音轨中的最高脉 冲的振幅是否大于子帧中所有音轨中的最大目标振幅的0.9倍,并且大于 其他脉冲振幅的10倍。
根据本发明某些实施方式的快速固定码本搜索方法可被应用于具有代 数码本的CELP编解码器,或者那些适合于具有代数型结构的稀疏多脉冲 编解码器。与其他搜索方法相比,该方法无需将被测试的脉冲位置的多种 组合,就可以降低复杂性。
根据本发明某些实施方式的CELP参数映射可被至少应用于基于 CELP的语音编解码器,以及现有编解码器G.723.1、GSM-AMR、 EVRC、G.728、G.729、G.729A、QCELP、MPEG-4、SMV、SMR-WB和 VMR之间的语音转码器。在本发明的某些实施方式中,快速固定码本映 射模块可以适合于使代数或多脉冲固定码本符合任意的音轨方向、脉冲数 目和子帧尺寸。在本发明的某些实施方式中,快速自适应码本映射模块可 应用于目的地编解码器使用多抽头基音滤波器的任意转码器构架。在本发 明的某些实施方式中,LSP参数映射模块、快速固定码本映射模块和快速 自适应码本映射模块彼此独立地进行操作。
使用本发明可以获得比其他技术更多的优势。本发明的某些实施方式 提供了用于快速LSP映射、快速自适应码本映射和快速固定码本映射的装 置和方法。该装置和方法可以调整被映射的线性预测参数,以防止目的地 编解码器的解码器中的信号溢出。本发明的某些实施方式可以减少计算量 以及计算复杂性的复杂度。例如,减少用于测试候选码矢的计算,或者减 少用于产生基音增益码本中的条目的计算。在本发明的某些实施方式中, 还减少了所需存储器的量。例如,简化的基音增益码本的每个码矢条目中 包含更少的元素。在本发明的某些实施方式中,自相关和互相关计算单元 以与简化的基音增益码本的条目中的项相匹配的格式输出长度被缩短的点 积元素矢量。在某些实施方式中,由于基音增益码本的简化,计算出的相 关点积数目的减小,计算出的残差信号数目的减少以及计算出的延时加权 合成信号数目的减少,因此本发明的自适应码本搜索的复杂度要低于其他 自适应码本搜索的复杂度。
虽然已经描述了本发明的具体实施方式,但是本领域的技术人员将会 理解,还存在与所述实施方式等同的其他实施方式。因此,将会理解,本 发明并不受限于具体的所示实施方式,而是受限于所附权利要求书的范 围。
本申请要求保护2002年10月25日递交的美国临时申请No. 60/421446、No.60/421449和No.60/421270的优先权,这里并入了其内容 以作为参考。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈