码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、专利检索-利兹线电缆，导体和接线专利检索查询-专利查询网

码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、

阅读：198发布：2020-12-04

专利汇可以提供码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、专利检索，专利查询，专利分析的服务。并且用于在代数代码簿中选择代码矢量的方法和装置,其中用于编码器的分析窗口超过目标语音帧的长度。由感知加权滤波器 (76)滤波输入信号。然后,设定滤波器以对于等于感知加权滤波器(76)的长度的采样数发出振铃,同时施加零输入矢量作为输入。通过扩展分析窗口,可以将两维冲激响应矩阵作为一维自相关矩阵存储在存储器 (60,80)中,这大大简化了计算复杂性和节省了搜索所需的存储量。，下面是码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、专利的具体信息内容。

权利要求

1.在一种提供合成语音的线性预测编码器中，其中短项和长项冗余由具有L 个抽头的滤波器从N个数字化语音采样帧中加以除去，产生N个采样的剩余的波形，所述滤波器具有冲激响应h(n)，一种运用k代码簿矢量Ck对所述剩余波形进行编码的方法，其特征在于，包括下列步骤：
将目标信号x(n)与所述冲激响应h(n)卷积以提供第一卷积；
对冲激响应矩阵自相关，其中所述冲激响应矩阵是带有作为第零个冲激响应值的对角线h(0)和较低对角线h(1)，…，h(L-1)的较低三角形托普利兹矩阵，而且根据下列等式计算所述冲激响应自相关： $Φ (i) = Σ_{n = 0}^{L - 1} h (n) h (n - i);$
根据所述冲激响应矩阵和所述代码簿矢量Ck的所述自相关，对所述合成语音自相关，以提供合成语音自相关值，Eyy；
根据所述第一卷积和所述代码簿矢量，使所述合成语音和所述目标语音互相关，以提供互相关值Exy；和
根据所述互相关值Exy和所述合成语音自相关值Eyy，选择代码簿矢量。
2.如权利要求1所述的方法，其特征在于，还包括下列步骤：
生成第一组滤波器系数；
生成第二组滤波器系数；
将所述第一组滤波器系数与所述第二组滤波器系数组合起来以提供所述冲激响应h(n)。
3.如权利要求1所述的方法，其特征在于，还包括：
接收N个数字化采样的所述输入帧；和
感知加权所述输入帧以提供所述目标信号。
4.如权利要求1所述的方法，其特征在于，根据下列等式执行将所述目标信号和所述冲激响应卷积的所述步骤：
5.如权利要求1所述的方法，其特征在于，还包括把所述冲激响应自相关存储在L个存储单元的存储器中。
6.如权利要求1所述的方法，其特征在于，根据下列等式执行使所述经合成语音和所述目标语音互相关的所述步骤： $E_{xy} = Σ_{k = 0}^{N_{p}} c_{i} (p_{k}) \cdot d (p_{k})$
其中d(k)是目标信号和脉冲响应的互相关。
7.如权利要求1所述的方法，其特征在于，根据下列等式执行使所述经合成语音自相关的步骤： $E_{yy} = N_{p} \cdot Φ (0) + 2 \cdot Σ_{i = 0}^{N_{p}} Σ_{j = i + 1}^{N_{p}} c_{k} (p_{i}) \cdot c_{k} (p_{j}) \cdot Φ | p_{i} - p_{j} |$
8.如权利要求1所述的方法，其特征在于，选择代码簿矢量的所述步骤包括：
对于每个代码矢量，Ck，求值Cxy的平方；
对于每个代码矢量Ck，用Exy的所述平方除经计算值Eyy；和
选择使Eyy与Exy的平方之商最大的代码矢量。
9.如权利要求1所述的方法，其特征在于，根据代数代码簿格式，选择所述代码簿矢量，Ck。

说明书全文

发明领域

本发明涉及语音处理。特别是，本发明涉及用于将最佳激励矢量设置在码激励线性预测(CELP)编码器内的新颖和经改进的方法及装置。

相关技术的描述

运用数字技术传输语音已十分普遍，特别是，在长途和数字无线电话应用中。这反过来对确定方法产生兴趣，这种方法使在传输信道上传输的信息量最小，同时使重组的语音保持高质量。如果通过简单采样和数字化发送语音，那么需要大约为64千比特/秒(kbps)的数据速率来获得传统模拟电话的语音质量。然而，通过运用语音分析，随后进行适当编码、发送和在接收机处的再合成，可以大大降低数据速率。

一般把采用通过提取与人语音生成的模型相关的参数的技术来压缩有声语音(voiced speech)的装置称为声码器。这种装置包括编码器和解码器，其中编码器分析输入语音以提取相关参数，而解码器运用在传输信道上接收到的该参数再合成语音。该模型不断地变化以正确地建立时间变化的语音信号的模型。于是，在计算参数期间，将语音分成时间块，或者分析帧。然后，每一新帧就更新参数。

在各种语音编码器中，码激励线性预测(CELP)编码、随机编码或矢量激励语音编码编码器(vector excited speech coding coder)属于一类。在Thomas E.Tremain 等人所著的论文“一种4.8kbps码激励线性预测编码器”( Proceedings ofthe Mobile Satellite Conference，1988)中描述这种特殊类型的编码算法的例子。类似地，在美国专利第5,414,796号(发明名称为“变速率声码器”，已转让给本发明的受让人，并作为参考资料在此引入)中描述这种其它声码器的例子。

声码器的功能在于通过除去在语音中固有的所有自然冗余码，把数字化语音信号压缩成低比特率信号。在CELP编码器中，利用短项共振峰(short term formant)(或LPC)滤波器去除冗余码。一旦除去这些冗余，可以建立所得剩余信号的模型作为白高斯噪声，其中还必须对该噪声进行编码。

下面详细描述确定对于给定语音帧的编码参数的处理过程。首先，通过找到滤波器系数来确定LPC滤波器的参数，它去除由声域滤波引起的在语音中的短期冗余。接着，通过用在代码簿中的多个随机激励波形来驱动LPC滤波器并选择导致LPC滤波器的输出最接近于原始语音的特定激励波形，来选择在解码器处被输入到LPC滤波器的激励信号。于是，被发送的参数涉及(1)LPC滤波器和(2)代码簿激励矢量的识别。

把预定(promising)激励代码簿结构称为代数码簿。在现有技术中，已知代数码簿的实际结构，而且在由J.P.Adoul等人所著的文章“根据代数码的快速CELP 编码”(1987年4月6-9日， Proceedings of ICASSP)中描述它。还在美国专利第 5,444,816号(发明名称为“根据代数码的有效语音编码的动态代码簿”，并作为参考资料在此引入)中进一步描述对代数码的运用。

发明概述

通过基于CELP编码器的合成所进行的分析运用最小均方误差测量(measure) 来将最佳合成语音矢量与目标语音矢量匹配。用这种测量来搜索代码矢量 (codevector)代码簿以选择当前子帧的最佳矢量。这种均方误差测量一般局限于窗口，在该窗口范围内选择激励代码矢量，而且不计及该代码矢量对被搜索的下一个子帧所做的贡献。

在本发明中，扩展使均方误差测量最小的窗口尺寸以说明在当前子帧中的代码矢量的振铃(ringing)进入到下一子帧的原因。窗口扩展等于感知(perceptual)加权滤波器的冲激响应的长度，h(n)。在本发明中的均方误差方法与在LPC分析中用到的最小均方误差的自相关方法相类似，由Thomas E.Tremain等人在“一种 4.8kbps码激励线性预测编码器”( Proceedings of the Mobile Satellite Conference， 1988)一文中描述了上述自相关方法。

根据这种观点用公式阐明均方误差问题，比起当前解决方法，本发明有下列优点：

1.)在测量中说明从当前子帧到下一个子帧的代码矢量的振铃，然后与设置在矢量开始部分的脉冲相同地对设置在矢量末端的脉冲加权。

2.)对于整个子帧，感知加权滤波器的冲激响应变得稳定，以产生h(n)，Φ(i，j)， Toeplitz的自相关矩阵或者上述另一种方法，Φ(i，j)＝Φ|i-j|。于是，本发明使2-D 矩阵变成1-D矢量，而且减小了代码簿搜索以及计算操作所需的RAM。

附图说明

当结合附图，通过下面详细的说明，本发明的特性、目的和优点将显而易见，在附图中相同标号表示相应部分，其中：

图1示出用于在ACELP编码器中选择代码矢量的传统装置；

图2是用于在ACELP编码器中选择代码矢量的本发明的装置的方框图；和

图3是示出用于选择本发明中代码矢量的方法的流程图。

较佳实施例的详细描述

图1示出用于执行代数代码簿搜索的传统装置和方法。代码簿发生器6包括脉冲发生器2，它响应于脉冲位置信号，Pi，生成带有在第i位置上的单位脉冲的信号。在示例实施例中，代码簿激励矢量包括四十个采样，而且将单位冲激的可能位置分成轨迹(track)T0至T4，如下表1所示。

表 1

轨迹位置

T0 0，5，10，15，20，25，30，35

T1 1，6，11，16，21，26，31，36

T2 2，7，12，17，22，27，32，37

T3 3，8，13，18，23，28，33，38

T4 4，9，10，19，24，29，34，39

在示例实施例中，由脉冲发生器2为每个轨迹提供一个脉冲。Np是在激励矢量中的脉冲数。在示例实施例中，Np是5。对于每个脉冲，Pi，将相应符号 Si分配给该脉冲。由乘法器4示出脉冲的符号，其中乘法器4把在位置Pi处的单位脉冲与符号值Si相乘。由下面等式(1)给定所得代码矢量，Ck。 $c_{k} (j) = Σ_{i = 0}^{N_{p} - 1} s_{i} \cdot δ (j - p_{i}) . . . . . . . (1)$

滤波器发生器12生成对于共振峰滤波器的抽头值(tap value)，h(n)，如在现有技术中熟知并在上述美国专利第5,414,796号中所述的那样。一般，对于M个采样可以计算冲激函数，h(n)，其中M是被搜索的子帧长度，例如，40。

向存储元件13提供复合滤波器系数，h(n)，并作为两维三角Toeplitz矩阵(H) 存储在存储元件13中，其中对角线是h(0)，而且较低对角线是h(1)…，h(M-1)，如下所示。

由存储器13向矩阵乘法元件14提供该值。然后，根据下列等式(3)，将H 与它的转置矩阵相乘以给定冲激响应矩阵Φ的相关性。

然后，向存储元件18提供相关运算的结果，并作为两维矩阵存储在存储元件18中，其中在该实施例中两维矩阵需要存储器中402或1600个位置。

对感知加权滤波器32提供输入语音帧s(n)并由该滤波器32对其进行滤波，以提供目标信号x(n)。在现有技术中已知感知加权滤波器32的设计方案及实施过程，而且在上述美国专利第5,414,796号中对其进行详细描述。

向矩阵乘法元件16提供目标信号的采样值x(n)和冲激矩阵值H(n)，其中所述矩阵乘法元件16根据下列等式(4)计算在目标信号和冲激响应之间的互相关性。

向矩阵乘法元件22提供来自存储元件20的值d(i)和代码簿矢量幅度要素 (element)的值Ck，其中所述矩阵乘法元件22根据下列等式(5)，将代码簿矢量幅度要素与矢量d(n)相乘，并对所得值求平方。 $E_{xy}^{2} = {(Σ_{i = 0}^{N_{p} - 1} c_{k} (p_{i}) \cdot d (p_{i}))}^{2} . . . . . . . (5)$

向矩阵乘法元件26提供代码簿幅度要素Ck和代码簿脉冲位置矢量p。矩阵乘法元件26根据下列等式(6)计算值Eyy。 $E_{yy} = Σ_{i = 0}^{N_{p} - 1} φ (p_{i}, p_{j}) + 2 \cdot Σ_{i = 0}^{N_{p} - 1} Σ_{j = i + 1}^{N_{p} - 1} c_{k} (p_{i}) c_{k} (p_{j}) φ (p_{i}, p_{j}) . . . . (6)$

向除法器28提供Eyy和(Exy)2的值，其中除法器28根据下列等式(7)计算值 Tk。 $T_{k} = \frac{{(E_{xy})}^{2}}{E_{yy}} . . . . . . (7)$

向极小化元件30提供对于每个代码簿矢量幅度要素Ck的值和编码的脉冲位置矢量P，而且选择使值Tk最大的代码簿矢量。

参照图2，示出用于在本发明中选择代码矢量的装置。在图3中，示出本发明的运算(operational)流程的流程图。首先，在框100中，本发明预先计算值d(k)，由于它的值不随着被搜索的代码矢量而变化，所以可以预先计算并存储它。

向生成目标信号x(n)的感知加权滤波器76提供语音帧s(n)。所得目标语音段 x(n)包括向乘法和累加元件78提供的M+L-1个感知加权采样。L是感知加权滤波器76的冲激响应的长度。通过感知加权滤波器76对语音信号的M个采样进行滤波，然后继续使这个滤波器对于L-1个附加采样发出振铃(ring out)同时施加零输入矢量作为到感知加权滤波器76的输入，产生这个扩展的长度目标语音矢量 x(n)。

如前面参照滤波器发生器12所述，滤波器发生器56计算对于共振峰滤波器的滤波器抽头系数，而且根据这些系数确定冲激响应h(n)。然而，滤波器发生器 56根据从0至L-1的延迟，生成滤波器响应，其中L是冲激响应h(n)的长度。应注意，虽然如在示例实施例中所述没有音调滤波器(pitch filter)，但是正如现有技术中已知的那样，通过对冲激响应的简单变更，同样可以可将本发明用于存在音调滤波器的情况。

向乘法和累加元件78提供来自滤波器发生器56的值h(n)。乘法和累加元件 78根据下面的等式(8)计算目标序列x(n)与滤波冲激响应h(n)的互相关。

然后，把计算值d(n)存储在存储元件80中。

在框102中，本发明预先计算计算Eyy所需的值Φ。在这里，实现本发明的节省存储器的最大获益。由于均方误差测量已超过较大窗口，所以现在h(n)在整个子帧范围内不变，之后由于Φ(i，j)＝Φ(|i-j|)，所以2-DΦ(i，j)矩阵变成1-D矢量。在如表1中所述的本实施例中，这意味着，传统方法需要1600个Ram存储单元，而本发明只需要40个。此外，在整个2-D矩阵，计算和存储1-D矢量的过程中也可以获得运算总数节省(operation count savings)。在本发明中，根据下面的等式 (9)，计算值Φ。 $Φ (i) = Σ_{n = 0}^{L - 1} h (n) h (n - i) . . . . . . . (9)$

把值Φ(i)存储在存储元件80中，其中存储元件80只需要L个存储单元，这与需要存储M2个元素的传统方法不同。在本实施例中，L＝M。

在框104中，本发明计算互相关值Exy。向乘法和累加元件62提供存储在存储元件80中的值d(k)和来自代码簿发生器50的当前代码簿矢量ci(k)。乘法和累加元件62根据等式(10)计算目标矢量x(k)和代码簿矢量幅度要素ci(k)的互相关。 $E_{xy} = Σ_{k = 0}^{N_{p}} c_{i} (p_{k}) \cdot d (p_{k}) . . . . . . (10)$

于是，向计算Exy平方的平方装置64提供值Exy。

在框106中，本发明计算经合成语音的自相关值，Eyy。由代码簿发生器50 向乘法和累加元件70提供代码簿矢量幅度要素ci(k)和cj(k)。此外，向乘法和累加元件70提供来自存储元件60的值Φ|i-j|。乘法和累加元件70计算在下面等式(11) 中给出的值。 $Σ_{i = 0}^{N_{p}} Σ_{j = i + 1}^{N_{p}} c_{k} (p_{i}) \cdot c_{k} (p_{j}) \cdot Φ | p_{i} - p_{j} | . . . . . . (11)$

向乘法器72提供经乘法和累加装置70计算的值，其中将它的值加倍。向加法器74的第一输入提供来自乘法器72的积。

存储元件60向乘法器75提供Φ(0)的值，其中将它与值Np相乘。向加法器 74的第二输入提供来自乘法器75的积。来自加法器74的和是根据下面的等式(12) 给定的值Eyy。 $E_{yy} = N_{p} \cdot Φ (0) + 2 \cdot Σ_{i = 0}^{N_{p}} Σ_{j = i + 1}^{N_{p}} c_{k} (p_{i}) \cdot c_{k} (p_{j}) \cdot Φ | p_{i} - p_{j} | . . . . . (12)$

通过本发明的等式(12)与传统搜索方法的等式(6)相比较，可以获得对计算资源的节省的理解。这种节省源于比起Φ(pi，pj)的2-D存取而言对1-D矩阵(Φ|pi-pj|) 的更快的寻址、源于Eyy计算所需的更少加法(对于示例实施例，等式(6)需要15 次加法，而等式(12)需要11次，假设ck(pi)只取1或-1符号项)并源于由于不需要存储Φ(i，i)而对1360Ram存储单元节省。

在框108中，本发明计算(Eyy)2/Eyy的值。向除法器66的第一输入提供来自加法元件74的值Eyy。向除法器66的第二输入提供由平方装置64提供的(Exy)2 的值。然后，除法器66计算由下面等式(13)给定的商。 $\frac{E_{xy}^{2}}{E_{yy}} . . . . . . . . (13)$

向最小化元件66提供来自除法器66的商值。在框110中，如果未测试所有矢量Ck，那么流程回到框104，而且如上所述测试下一个代码矢量。然后，如果已测试所有矢量，那么在框112中，最小化元件68选择代码矢量，它导致 (Exy)2/Eyy的最大值。

提供较佳实施例的上述说明以使熟悉本技术领域的任何人员能够进行或使用本发明。对于熟悉本技术的人员，对这些实施例的各种变更是显而易见的，而且这里所述的一般原理可应用于其它实施例，而不需要进行创造性劳动。于是，本发明并不局限于这里所示的实施例，而是根据与这里所揭示的原理和新颖性一致的最宽范围。

标题	发布/更新时间	阅读量
一种基于多孔导热材料的热管散热系统	2020-05-11	34
适用于高频磁耦合式无线充电系统的利兹线的制备方法	2020-05-13	89
三相AC电抗器及其制造方法以及马达驱动装置	2020-05-11	302
一种三电平与可调LCC谐振无线充电系统	2020-05-11	76
均匀矩形阵列下的全方向波束赋形设计方法	2020-05-12	601
核电压力容器接管组焊电磁感应加热装置及其使用方法	2020-05-14	573
一种巡检无人机高压电缆无线充电装置及方法	2020-05-15	406
一种无线传输网络补偿供电系统	2020-05-17	156
蜂窝形无线供能装置	2020-05-12	195
电刺激装置	2020-05-08	64

码激励线性预测(CELP)编码器中搜索激励代码簿的方法和装置、

发明领域

该功能需要专业版企业版VIP权限，您可以：