首页 / 专利库 / 电缆,导体和接线 / 利兹线 / 码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、

码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、

阅读:198发布:2020-12-04

专利汇可以提供码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、专利检索,专利查询,专利分析的服务。并且用于在代数代码簿中选择代码矢量的方法和装置,其中用于 编码器 的分析窗口超过目标语音 帧 的长度。由 感知 加权 滤波器 (76)滤波输入 信号 。然后,设定滤波器以对于等于感知加权滤波器(76)的长度的 采样 数发出振铃,同时施加零输入矢量作为输入。通过扩展分析窗口,可以将两维冲激响应矩阵作为一维 自相关矩阵 存储在 存储器 (60,80)中,这大大简化了计算复杂性和节省了搜索所需的存储量。,下面是码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、专利的具体信息内容。

1.在一种提供合成语音的线性预测编码器中,其中短项和长项冗余由具有L 个抽头的滤波器从N个数字化语音采样中加以除去,产生N个采样的剩余的波 形,所述滤波器具有冲激响应h(n),一种运用k代码簿矢量Ck对所述剩余波形 进行编码的方法,其特征在于,包括下列步骤:
将目标信号x(n)与所述冲激响应h(n)卷积以提供第一卷积;
对冲激响应矩阵自相关,其中所述冲激响应矩阵是带有作为第零个冲激响应 值的对线h(0)和较低对角线h(1),…,h(L-1)的较低三角形托普利兹矩阵,而且根 据下列等式计算所述冲激响应自相关: Φ ( i ) = Σ n = 0 L - 1 h ( n ) h ( n - i ) ;
根据所述冲激响应矩阵和所述代码簿矢量Ck的所述自相关,对所述合成语 音自相关,以提供合成语音自相关值,Eyy;
根据所述第一卷积和所述代码簿矢量,使所述合成语音和所述目标语音互相 关,以提供互相关值Exy;和
根据所述互相关值Exy和所述合成语音自相关值Eyy,选择代码簿矢量。
2.如权利要求1所述的方法,其特征在于,还包括下列步骤:
生成第一组滤波器系数;
生成第二组滤波器系数;
将所述第一组滤波器系数与所述第二组滤波器系数组合起来以提供所述冲 激响应h(n)。
3.如权利要求1所述的方法,其特征在于,还包括:
接收N个数字化采样的所述输入帧;和
感知加权所述输入帧以提供所述目标信号。
4.如权利要求1所述的方法,其特征在于,根据下列等式执行将所述目标信 号和所述冲激响应卷积的所述步骤:
5.如权利要求1所述的方法,其特征在于,还包括把所述冲激响应自相关存 储在L个存储单元的存储器中。
6.如权利要求1所述的方法,其特征在于,根据下列等式执行使所述经合成 语音和所述目标语音互相关的所述步骤: E xy = Σ k = 0 N p c i ( p k ) · d ( p k )
其中d(k)是目标信号和脉冲响应的互相关。
7.如权利要求1所述的方法,其特征在于,根据下列等式执行使所述经合成 语音自相关的步骤: E yy = N p · Φ ( 0 ) + 2 · Σ i = 0 N p Σ j = i + 1 N p c k ( p i ) · c k ( p j ) · Φ | p i - p j |
8.如权利要求1所述的方法,其特征在于,选择代码簿矢量的所述步骤包 括:
对于每个代码矢量,Ck,求值Cxy的平方;
对于每个代码矢量Ck,用Exy的所述平方除经计算值Eyy;和
选择使Eyy与Exy的平方之商最大的代码矢量。
9.如权利要求1所述的方法,其特征在于,根据代数代码簿格式,选择所述 代码簿矢量,Ck。

说明书全文

发明领域

本发明涉及语音处理。特别是,本发明涉及用于将最佳激励矢量设置在码激 励线性预测(CELP)编码器内的新颖和经改进的方法及装置。

相关技术的描述

运用数字技术传输语音已十分普遍,特别是,在长途和数字无线电话应用 中。这反过来对确定方法产生兴趣,这种方法使在传输信道上传输的信息量最 小,同时使重组的语音保持高质量。如果通过简单采样和数字化发送语音,那么 需要大约为64千比特/秒(kbps)的数据速率来获得传统模拟电话的语音质量。然 而,通过运用语音分析,随后进行适当编码、发送和在接收机处的再合成,可以 大大降低数据速率。

一般把采用通过提取与人语音生成的模型相关的参数的技术来压缩有声语 音(voiced speech)的装置称为声码器。这种装置包括编码器和解码器,其中编码器 分析输入语音以提取相关参数,而解码器运用在传输信道上接收到的该参数再合 成语音。该模型不断地变化以正确地建立时间变化的语音信号的模型。于是,在 计算参数期间,将语音分成时间,或者分析。然后,每一新帧就更新参数。

在各种语音编码器中,码激励线性预测(CELP)编码、随机编码或矢量激励语 音编码编码器(vector excited speech coding coder)属于一类。在Thomas E.Tremain 等人所著的论文“一种4.8kbps码激励线性预测编码器”( Proceedings ofthe Mobile Satellite Conference,1988)中描述这种特殊类型的编码算法的例子。类似地,在美 国专利第5,414,796号(发明名称为“变速率声码器”,已转让给本发明的受让人, 并作为参考资料在此引入)中描述这种其它声码器的例子。

声码器的功能在于通过除去在语音中固有的所有自然冗余码,把数字化语音 信号压缩成低比特率信号。在CELP编码器中,利用短项共振峰(short term formant)(或LPC)滤波器去除冗余码。一旦除去这些冗余,可以建立所得剩余信号 的模型作为白高斯噪声,其中还必须对该噪声进行编码。

下面详细描述确定对于给定语音帧的编码参数的处理过程。首先,通过找到 滤波器系数来确定LPC滤波器的参数,它去除由声域滤波引起的在语音中的短期 冗余。接着,通过用在代码簿中的多个随机激励波形来驱动LPC滤波器并选择导 致LPC滤波器的输出最接近于原始语音的特定激励波形,来选择在解码器处被输 入到LPC滤波器的激励信号。于是,被发送的参数涉及(1)LPC滤波器和(2)代码 簿激励矢量的识别。

把预定(promising)激励代码簿结构称为代数码簿。在现有技术中,已知代数 码簿的实际结构,而且在由J.P.Adoul等人所著的文章“根据代数码的快速CELP 编码”(1987年4月6-9日, Proceedings of ICASSP)中描述它。还在美国专利第 5,444,816号(发明名称为“根据代数码的有效语音编码的动态代码簿”,并作为 参考资料在此引入)中进一步描述对代数码的运用。

发明概述

通过基于CELP编码器的合成所进行的分析运用最小均方误差测量(measure) 来将最佳合成语音矢量与目标语音矢量匹配。用这种测量来搜索代码矢量 (codevector)代码簿以选择当前子帧的最佳矢量。这种均方误差测量一般局限于窗 口,在该窗口范围内选择激励代码矢量,而且不计及该代码矢量对被搜索的下一 个子帧所做的贡献。

在本发明中,扩展使均方误差测量最小的窗口尺寸以说明在当前子帧中的代 码矢量的振铃(ringing)进入到下一子帧的原因。窗口扩展等于感知(perceptual)加 权滤波器的冲激响应的长度,h(n)。在本发明中的均方误差方法与在LPC分析中 用到的最小均方误差的自相关方法相类似,由Thomas E.Tremain等人在“一种 4.8kbps码激励线性预测编码器”( Proceedings of the Mobile Satellite Conference, 1988)一文中描述了上述自相关方法。

根据这种观点用公式阐明均方误差问题,比起当前解决方法,本发明有下列 优点:

1.)在测量中说明从当前子帧到下一个子帧的代码矢量的振铃,然后与设置 在矢量开始部分的脉冲相同地对设置在矢量末端的脉冲加权。

2.)对于整个子帧,感知加权滤波器的冲激响应变得稳定,以产生h(n),Φ(i,j), Toeplitz的自相关矩阵或者上述另一种方法,Φ(i,j)=Φ|i-j|。于是,本发明使2-D 矩阵变成1-D矢量,而且减小了代码簿搜索以及计算操作所需的RAM。

附图说明

当结合附图,通过下面详细的说明,本发明的特性、目的和优点将显而易见, 在附图中相同标号表示相应部分,其中:

图1示出用于在ACELP编码器中选择代码矢量的传统装置;

图2是用于在ACELP编码器中选择代码矢量的本发明的装置的方框图;和

图3是示出用于选择本发明中代码矢量的方法的流程图

较佳实施例的详细描述

图1示出用于执行代数代码簿搜索的传统装置和方法。代码簿发生器6包括 脉冲发生器2,它响应于脉冲位置信号,Pi,生成带有在第i位置上的单位脉冲 的信号。在示例实施例中,代码簿激励矢量包括四十个采样,而且将单位冲激的 可能位置分成轨迹(track)T0至T4,如下表1所示。

                           表  1

                 轨迹                     位置

                  T0                      0,5,10,15,20,25,30,35

                  T1                      1,6,11,16,21,26,31,36

                  T2                      2,7,12,17,22,27,32,37

                  T3                      3,8,13,18,23,28,33,38

                  T4                      4,9,10,19,24,29,34,39

在示例实施例中,由脉冲发生器2为每个轨迹提供一个脉冲。Np是在激励 矢量中的脉冲数。在示例实施例中,Np是5。对于每个脉冲,Pi,将相应符号 Si分配给该脉冲。由乘法器4示出脉冲的符号,其中乘法器4把在位置Pi处的单 位脉冲与符号值Si相乘。由下面等式(1)给定所得代码矢量,Ck。 c k ( j ) = Σ i = 0 N p - 1 s i · δ ( j - p i ) . . . . . . . ( 1 )

滤波器发生器12生成对于共振峰滤波器的抽头值(tap value),h(n),如在现 有技术中熟知并在上述美国专利第5,414,796号中所述的那样。一般,对于M个 采样可以计算冲激函数,h(n),其中M是被搜索的子帧长度,例如,40。

向存储元件13提供复合滤波器系数,h(n),并作为两维三Toeplitz矩阵(H) 存储在存储元件13中,其中对角线是h(0),而且较低对角线是h(1)…,h(M-1), 如下所示。

存储器13向矩阵乘法元件14提供该值。然后,根据下列等式(3),将H 与它的转置矩阵相乘以给定冲激响应矩阵Φ的相关性。

然后,向存储元件18提供相关运算的结果,并作为两维矩阵存储在存储元 件18中,其中在该实施例中两维矩阵需要存储器中402或1600个位置。

对感知加权滤波器32提供输入语音帧s(n)并由该滤波器32对其进行滤波, 以提供目标信号x(n)。在现有技术中已知感知加权滤波器32的设计方案及实施过 程,而且在上述美国专利第5,414,796号中对其进行详细描述。

向矩阵乘法元件16提供目标信号的采样值x(n)和冲激矩阵值H(n),其中所 述矩阵乘法元件16根据下列等式(4)计算在目标信号和冲激响应之间的互相关 性。

向矩阵乘法元件22提供来自存储元件20的值d(i)和代码簿矢量幅度要素 (element)的值Ck,其中所述矩阵乘法元件22根据下列等式(5),将代码簿矢量幅 度要素与矢量d(n)相乘,并对所得值求平方。 E xy 2 = ( Σ i = 0 N p - 1 c k ( p i ) · d ( p i ) ) 2 . . . . . . . ( 5 )

向矩阵乘法元件26提供代码簿幅度要素Ck和代码簿脉冲位置矢量p。矩阵 乘法元件26根据下列等式(6)计算值Eyy。 E yy = Σ i = 0 N p - 1 φ ( p i , p j ) + 2 · Σ i = 0 N p - 1 Σ j = i + 1 N p - 1 c k ( p i ) c k ( p j ) φ ( p i , p j ) . . . . ( 6 )

向除法器28提供Eyy和(Exy)2的值,其中除法器28根据下列等式(7)计算值 Tk。 T k = ( E xy ) 2 E yy . . . . . . ( 7 )

向极小化元件30提供对于每个代码簿矢量幅度要素Ck的值和编码的脉冲位 置矢量P,而且选择使值Tk最大的代码簿矢量。

参照图2,示出用于在本发明中选择代码矢量的装置。在图3中,示出本发 明的运算(operational)流程的流程图。首先,在框100中,本发明预先计算值d(k), 由于它的值不随着被搜索的代码矢量而变化,所以可以预先计算并存储它。

向生成目标信号x(n)的感知加权滤波器76提供语音帧s(n)。所得目标语音段 x(n)包括向乘法和累加元件78提供的M+L-1个感知加权采样。L是感知加权滤 波器76的冲激响应的长度。通过感知加权滤波器76对语音信号的M个采样进行 滤波,然后继续使这个滤波器对于L-1个附加采样发出振铃(ring out)同时施加零 输入矢量作为到感知加权滤波器76的输入,产生这个扩展的长度目标语音矢量 x(n)。

如前面参照滤波器发生器12所述,滤波器发生器56计算对于共振峰滤波器 的滤波器抽头系数,而且根据这些系数确定冲激响应h(n)。然而,滤波器发生器 56根据从0至L-1的延迟,生成滤波器响应,其中L是冲激响应h(n)的长度。应 注意,虽然如在示例实施例中所述没有音调滤波器(pitch filter),但是正如现有技 术中已知的那样,通过对冲激响应的简单变更,同样可以可将本发明用于存在音 调滤波器的情况。

向乘法和累加元件78提供来自滤波器发生器56的值h(n)。乘法和累加元件 78根据下面的等式(8)计算目标序列x(n)与滤波冲激响应h(n)的互相关。

然后,把计算值d(n)存储在存储元件80中。

在框102中,本发明预先计算计算Eyy所需的值Φ。在这里,实现本发明的 节省存储器的最大获益。由于均方误差测量已超过较大窗口,所以现在h(n)在整 个子帧范围内不变,之后由于Φ(i,j)=Φ(|i-j|),所以2-DΦ(i,j)矩阵变成1-D矢量。 在如表1中所述的本实施例中,这意味着,传统方法需要1600个Ram存储单元, 而本发明只需要40个。此外,在整个2-D矩阵,计算和存储1-D矢量的过程中 也可以获得运算总数节省(operation count savings)。在本发明中,根据下面的等式 (9),计算值Φ。 Φ ( i ) = Σ n = 0 L - 1 h ( n ) h ( n - i ) . . . . . . . ( 9 )

把值Φ(i)存储在存储元件80中,其中存储元件80只需要L个存储单元,这 与需要存储M2个元素的传统方法不同。在本实施例中,L=M。

在框104中,本发明计算互相关值Exy。向乘法和累加元件62提供存储在 存储元件80中的值d(k)和来自代码簿发生器50的当前代码簿矢量ci(k)。乘法和 累加元件62根据等式(10)计算目标矢量x(k)和代码簿矢量幅度要素ci(k)的互相 关。 E xy = Σ k = 0 N p c i ( p k ) · d ( p k ) . . . . . . ( 10 )

于是,向计算Exy平方的平方装置64提供值Exy。

在框106中,本发明计算经合成语音的自相关值,Eyy。由代码簿发生器50 向乘法和累加元件70提供代码簿矢量幅度要素ci(k)和cj(k)。此外,向乘法和累 加元件70提供来自存储元件60的值Φ|i-j|。乘法和累加元件70计算在下面等式(11) 中给出的值。 Σ i = 0 N p Σ j = i + 1 N p c k ( p i ) · c k ( p j ) · Φ | p i - p j | . . . . . . ( 11 )

向乘法器72提供经乘法和累加装置70计算的值,其中将它的值加倍。向加 法器74的第一输入提供来自乘法器72的积。

存储元件60向乘法器75提供Φ(0)的值,其中将它与值Np相乘。向加法器 74的第二输入提供来自乘法器75的积。来自加法器74的和是根据下面的等式(12) 给定的值Eyy。 E yy = N p · Φ ( 0 ) + 2 · Σ i = 0 N p Σ j = i + 1 N p c k ( p i ) · c k ( p j ) · Φ | p i - p j | . . . . . ( 12 )

通过本发明的等式(12)与传统搜索方法的等式(6)相比较,可以获得对计算资 源的节省的理解。这种节省源于比起Φ(pi,pj)的2-D存取而言对1-D矩阵(Φ|pi-pj|) 的更快的寻址、源于Eyy计算所需的更少加法(对于示例实施例,等式(6)需要15 次加法,而等式(12)需要11次,假设ck(pi)只取1或-1符号项)并源于由于不需要 存储Φ(i,i)而对1360Ram存储单元节省。

在框108中,本发明计算(Eyy)2/Eyy的值。向除法器66的第一输入提供来自 加法元件74的值Eyy。向除法器66的第二输入提供由平方装置64提供的(Exy)2 的值。然后,除法器66计算由下面等式(13)给定的商。 E xy 2 E yy . . . . . . . . ( 13 )

向最小化元件66提供来自除法器66的商值。在框110中,如果未测试所有 矢量Ck,那么流程回到框104,而且如上所述测试下一个代码矢量。然后,如 果已测试所有矢量,那么在框112中,最小化元件68选择代码矢量,它导致 (Exy)2/Eyy的最大值。

提供较佳实施例的上述说明以使熟悉本技术领域的任何人员能够进行或使 用本发明。对于熟悉本技术的人员,对这些实施例的各种变更是显而易见的,而 且这里所述的一般原理可应用于其它实施例,而不需要进行创造性劳动。于是, 本发明并不局限于这里所示的实施例,而是根据与这里所揭示的原理和新颖性一 致的最宽范围。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈