首页 / 专利库 / 齿轮 / 节距 / 开环节距跟踪平滑

开环节距跟踪平滑

阅读:441发布:2020-05-12

专利汇可以提供开环节距跟踪平滑专利检索,专利查询,专利分析的服务。并且提供一种用于执行以下 算法 的语音 编码器 ,该算法包括:获得(205)来自语音 信号 当前 帧 的多个开环 节距 候选,这多个开环节距候选包括第一开环节距候选和第二开环节距候选;获得(205)来自一个或者多个先前帧的整音信息;以及使用来自一个或者多个先前帧的整音信息来选择(280)多个开环节距候选之一作为当前帧的最终节距。在一个方面中,来自一个或者多个先前帧的整音信息包括一个或者多个先前帧的先前节距。在又一方面中,选择当前帧的最终节距包括选择(210)来自具有最大长期相关值的开环节距候选的初始开环节距。,下面是开环节距跟踪平滑专利的具体信息内容。

1.一种执行开环节距分析的方法,包括:
获得包括第一开环节距候选(p_max1)、第二开环节距候选(p_max2) 和第三开环节距候选(p_max3)的多个开环节距候选,其中 p_max1>p_max2>p_max3;
获得包括用于所述多个开环节距候选中各对应开环节距候选的第一相 关值(max1)、第二相关值(max2)和第三相关值(max3)的多个长期 相关值;
从所述多个开环节距候选中选择初始开环节距(max),其中与max (p_max)对应的所述长期相关值在所述长期相关值之中具有最大长期相 关值;
如果p_max2小于p_max,则:
如果小于p_max2的先前节距的绝对值小于第一预定比较值,则将第 一阈值设置为第一预定阈值,而如果小于p_max2的所述先前节距的所述 绝对值不小于所述第一预定比较值,则将所述第一阈值设置为第二预定阈 值;
如果与所述第一阈值相乘的max小于max2,则将max设置为max2 而将p_max设置为p_max2;
如果p_max3小于p_max,则:
如果小于p_max3的先前节距的绝对值小于第二预定比较值,则将第 二阈值设置为第三预定阈值,而如果小于p_max3的所述先前节距的所述 绝对值不小于所述第二预定比较值,则将所述第二阈值设置为第四预定阈 值;以及如果与所述第二阈值相乘的max小于max3,则将p_max设置为 p_max3。
2.根据权利要求1所述的方法,其中所述第一预定比较值是10、所 述第一预定阈值是0.7而所述第二预定阈值是0.9。
3.根据权利要求2所述的方法,其中所述第二预定比较值是5、所述 第三预定阈值是0.7而所述第四预定阈值是0.9。
4.根据权利要求1所述的方法,其中所述先前节距来自一个或者多个 先前
5.根据权利要求1所述的方法,其中所述先前帧来自紧邻前一帧。
6.一种配置用以执行开环节距分析算法的语音编码器,所述开环节距 分析算法包括:
获得包括第一开环节距候选(p_max1)、第二开环节距候选(p_max2) 和第三开环节距候选(p_max3)的多个开环节距候选,其中 p_max1>p_max2>p_max3;
获得包括用于所述多个开环节距候选中各对应开环节距候选的第一相 关值(max1)、第二相关值(max2)和第三相关值(max3)的多个长期 相关值;
从所述多个开环节距候选中选择初始开环节距(max),其中与max (p_max)对应的所述长期相关值在所述长期相关值之中具有最大长期相 关值;
如果p_max2小于p_max,则:
如果小于p_max2的先前节距的绝对值小于第一预定比较值,则将第 一阈值设置为第一预定阈值,而如果小于p_max2的所述先前节距的所述 绝对值不小于所述第一预定比较值,则将所述第一阈值设置为第二预定阈 值;
如果与所述第一阈值相乘的max小于max2,则将max设置为max2 而将p_max设置为p_max2;
如果p_max3小于p_max,则:
如果小于p_max3的先前节距的绝对值小于第二预定比较值,则将第 二阈值设置为第三预定阈值,而如果小于p_max3的所述先前节距的所述 绝对值不小于所述第二预定比较值,则将所述第二阈值设置为第四预定阈 值;以及如果与所述第二阈值相乘的max小于max3,则将p_max设置为 p_max3。
7.根据权利要求6所述的语音编码器,其中所述第一预定比较值是 10、所述第一预定阈值是0.7而所述第二预定阈值是0.9。
8.根据权利要求7所述的语音编码器,其中所述第二预定比较值是5、 所述第三预定阈值是0.7而所述第四预定阈值是0.9。
9.根据权利要求6所述的语音编码器,其中所述先前节距来自一个或 者多个先前帧。
10.根据权利要求6所述的语音编码器,其中所述先前帧来自紧邻前 一帧。
11.一种执行开环节距分析的方法,包括:
获得包括第一开环节距候选(p_max1)、第二开环节距候选(p_max2) 和第三开环节距候选(p_max3)的多个开环节距候选,其中 p_max1>p_max2>p_max3;
获得包括用于所述多个开环节距候选中各对应开环节距候选的第一相 关值(max1)、第二相关值(max2)和第三相关值(max3)的多个长期 相关值;
从所述多个开环节距候选中选择初始开环节距(max),其中与max (p_max)对应的所述长期相关值在所述长期相关值之中具有最大长期相 关值;
如果p_max2小于p_max,则基于第一判决将max设置为max2而将 p_max设置为p_max2;以及
如果p_max3小于p_max,则基于第二判决将p_max设置为p_max3。
12.根据权利要求11所述的方法,还包括:
获得来自一个或者多个先前帧的整音信息;以及
将来自所述一个或者多个先前帧的所述整音信息用于所述第一判决和 所述第二判决中的各判决。
13.根据权利要求12所述的方法,其中来自所述一个或者多个先前帧 的所述整音信息包括所述一个或者多个先前帧的先前节距。
14.根据权利要求12所述的方法,其中来自所述一个或者多个先前帧 的所述整音信息是来自紧邻前一帧的节距。
15.根据权利要求11所述的方法,其中所述第一判决包括:
如果小于p_max2的先前节距的绝对值小于第一预定比较值,则将第 一阈值设置为第一预定阈值,而如果小于p_max2的所述先前节距的所述 绝对值不小于所述第一预定比较值,则将所述第一阈值设置为第二预定阈 值;以及确定与所述第一阈值相乘的max是否小于max2。
16.根据权利要求15所述的方法,其中所述第一预定比较值是10、 所述第一预定阈值是0.7而所述第二预定阈值是0.9。
17.一种配置用以执行开环节距分析算法的语音编码器,所述开环节 距分析算法包括:
获得包括第一开环节距候选(p_max1)、第二开环节距候选(p_max2) 和第三开环节距候选(p_max3)的多个开环节距候选,其中 p_max1>p_max2>p_max3;
获得包括用于所述多个开环节距候选中各对应开环节距候选的第一相 关值(max1)、第二相关值(max2)和第三相关值(max3)的多个长期 相关值;
从所述多个开环节距候选中选择初始开环节距(max),其中与max (p_max)对应的所述长期相关值在所述长期相关值之中具有最大长期相 关值;
如果p_max2小于p_max,则基于第一判决将max设置为max2而将 p_max设置为p_max2;以及
如果p_max3小于p_max,则基于第二判决将p_max设置为p_max3。
18.根据权利要求17所述的语音编码器,其中所述开环节距分析算法 还包括:
获得来自一个或者多个先前帧的整音信息;以及
将来自所述一个或者多个先前帧的所述整音信息用于所述第一判决和 所述第二判决中的各判决。
19.根据权利要求18所述的语音编码器,其中来自所述一个或者多个 先前帧的所述整音信息包括所述一个或者多个先前帧的先前节距。
20.根据权利要求18所述的语音编码器,其中来自所述一个或者多个 先前帧的所述整音信息是来自紧邻前一帧的节距。
21.根据权利要求17所述的语音编码器,其中所述第一判决包括:
如果小于p_max2的先前节距的绝对值小于第一预定比较值,则将第 一阈值设置为第一预定阈值,而如果小于p_max2的所述先前节距的所述 绝对值不小于所述第一预定比较值,则将所述第一阈值设置为第二预定阈 值;以及确定与所述第一阈值相乘的max是否小于max2。
22.根据权利要求17所述的语音编码器,其中所述第一预定比较值是 10、所述第一预定阈值是0.7而所述第二预定阈值是0.9。

说明书全文

技术领域

发明主要涉及语音编码。具体而言,本发明涉及开环节距(pitch) 分析。

背景技术

语音压缩可以用来减少代表语音信号的位的数目,由此减少传输所需 带宽。然而,语音压缩可能造成解压语音的质量降级。一般而言,更高的 位速率将造成更高的质量而更低的位速率将造成更低的质量。然而,现代 语音压缩技术如编码技术可以在相对低的位速率产生相对高质量的解压 语音。一般而言,现代编码技术尝试代表语音信号感知重要的特征而不 保存实际语音波形。习惯称为编码解码器的语音压缩系统包括编码器和解 码器并且可以用来减少数字语音信号的位速率。已经为语音编码解码器开 发许多算法,这些算法减少对原语音进行数字编码所需要的位的数目而又 尝试维持高质量的重建语音。
国际电信联盟电信部(ITU-T)于1996年采用了称为G.729建议书 的长途质量语音编码算法,该建议书的标题为“Coding of Speech Signals at 8bits/s using Conjugate-Structure Algebraic-Core-Excited Linear-Predication(CS-ACELP)”,通过援引将该建议书整体结合于本申 请中。
图1图示了如其中说明的G.729建议书的CS-ACELP(共轭结构代数 -代码-激励-线性-预测)编码器100中的语音信号流。与图1中各相邻的 标号表示G.729建议书内对各块的操作和功能进行描述的节编号。如图所 示,语音信号或者输入采样105进入高通和按比例缩减块(在G.729建议 书的第3.1节中有描述),其中在逐基础上向输入采样105施加预处理。 接着在逐帧基础上向预处理的语音信号施加LP分析115和开环节距搜索 120。如图1中所示在开环节距搜索120之后在逐帧基础上向语音信号施 加开环节距搜索125和代数搜索130,这样的结果是生成代码索引输出 135。
如图1中所示,开环节距搜索120包括在G.729建议书的第3.4节中 描述的查找开环节距延迟124。如其中说明的那样,为了减少搜索的复杂 度以求最佳自适应-代码簿延迟而将搜索范围限制于从开环节距分析中获 得的候选延迟Top。对每帧一次完成这一开环节距分析(10ms)。开环节 距估计使用来自计算加权语音122的加权语音信号sw(n)并且实施如下。
在第一步骤中在以下三个范围中:
i=1:80,...,143
i=2:40,...,79
i=3:20,...,39
查找三个相关最大值:
R ( k ) = Σ n = 0 79 sw ( n ) sw ( n - k )
其中:
sw ( n ) = s ( n ) + Σ i = 1 10 a i y 1 i s ( n - i ) - Σ i = 1 10 a i y 2 i sw ( n - i ) n = 0 , . . . , 39
通过下式正规化所得最大值R(ti),i=1,...,3:
R ( t i ) = R ( t i ) Σ n sw 2 ( n - t i ) i = 1 , . . . , 3
接着通过优选具有较低范围中的值的延迟来选择在这三个正规化相关 值之中的更优值。这通过加权与较长延迟对应的正规化相关值来完成。确 定最佳开环延迟Top如下:
Top=t1
R ( T op ) = R ( t 1 )
如果R′(t2)≥0.85R′(Top)
       R′(Top)=R′(t2)
       Top=t2
结束
如果R′(t3)≥0.85R′(Top)
R′(Top)=R′(t3)
   Top=t3
结束
将延迟范围分成三个部分并且优选较小值的上述过程用来避免选择节 距倍数。平滑开环节距跟踪可以帮助稳定语音感知质量。具体而言,当在 解码器侧应用帧擦除隐藏算法时时,平滑节距跟踪可以使节距预测(针对 损失帧的节距估计)更容易。然而,G.729建议书的上述常规算法没有提 供最优结果而可以进一步加以改进。例如,G.729建议书的常规算法有利 地仅使用当前帧信息来平滑开环节距跟踪以便避免节距倍数。
因而在本领域中需要改进常规开环节距分析以获得用于稳定语音感知 质量的更平滑开环节距跟踪。

发明内容

本发明涉及用于执行开环节距分析的系统和方法。在一个方面中,一 种语音编码器执行以下算法,该算法包括:获得包括第一开环节距候选 (p_max1)、第二开环节距候选(p_max2)和第三开环节距候选(p_max3) 的多个开环节距候选,其中p_max1>p_max2>p_max3;获得包括用于多个 开环节距候选中各对应开环节距候选的第一相关值(max1)、第二相关值 (max2)和第三相关值(max3)的多个长期相关值;以及从多个开环节 距候选中选择初始开环节距(max),其中与max(p_max)对应的长期相 关值在长期相关值之中具有最大长期相关值。
该算法也包括确定p_max2是否小于p_max,而如果是这样,则该算 法包括:如果小于p_max2的先前节距的绝对值小于第一预定比较值,则 将第一阈值设置为第一预定阈值,而如果小于p_max2的先前节距的绝对 值不小于第一预定比较值,则将第一阈值设置为第二预定阈值;以及如果 与第一阈值相乘的max小于max2,则将max设置为max2而将p_max设 置为p_max2;
该算法还包括确定p_max3是否小于p_max,而如果是这样,则该算 法包括:如果小于p_max3的先前节距的绝对值小于第二预定比较值,则 将第二阈值设置为第三预定阈值,而如果小于p_max3的先前节距的绝对 值不小于第二预定比较值,则将第二阈值设置为第四预定阈值;以及如果 与第二阈值相乘的max小于max3,则将p_max设置为p_max3。
在又一方面中,第一预定比较值是10、第一预定阈值是0.7而第二预 定阈值是0.9,并且第二预定比较值是5、第三预定阈值是0.7而第四预定 阈值是0.9。
在另一方面中,先前节距来自一个或者多个先前帧。在又一方面中, 先前帧来自紧邻前一帧。
在一个不同方面中,一种语音编码器执行以下算法,该算法包括: 获得包括第一开环节距候选(p_max1)、第二开环节距候选(p_max2) 和第三开环节距候选(p_max3)的多个开环节距候选,其中 p_max1>p_max2>p_max3;获得包括用于多个开环节距候选中各对应开 环节距候选的第一相关值(max1)、第二相关值(max2)和第三相关值 (max3)的多个长期相关值;从多个开环节距候选中选择初始开环节距 (max),其中与max(p_max)对应的长期相关值在长期相关值之中具 有最大长期相关值;如果p_max2小于p_max,则基于第一判决将max 设置为max2而将p_max设置为p_max2;以及如果p_max3小于p_max, 则基于第二判决将p_max设置为p_max3。
在又一方面中,开环节距分析算法还可以包括:获得来自一个或者 多个先前帧的整音信息;以及将来自一个或者多个先前帧的整音信息用 于第一判决和第二判决中的各判决。在一个方面中,来自一个或者多个 先前帧的整音信息包括一个或者多个先前帧的先前节距。另外在另一方 面中,来自一个或者多个先前帧的整音信息是来自紧邻前一帧的节距。
在另外一个方面中,第一判决包括:如果小于p_max2的先前节距的 绝对值小于第一预定比较值,则将第一阈值设置为第一预定阈值,而如 果小于p_max2的先前节距的绝对值不小于第一预定比较值,则将第一阈 值设置为第二预定阈值;以及确定与第一阈值相乘的max是否小于 max2,其中第一预定比较值是10、第一预定阈值是0.7而第二预定阈值 是0.9。
本发明的这些和其它方面将进一步参照以下附图说明书而变得清 楚。本意在于使所有这样的附加系统、特征和优点涵盖于本说明书中、 在本发明的范围内并且受所附权利要求保护。

附图说明

本发明的特征和优点对于在阅读以下具体描述和附图之后的本领域 技术人员而言将变得更容易明白,在附图中:
图1图示了G.729建议书的CS-ACELP编码器中的语音信号流,该 编码器包括执行常规开环节距分析算法的查找开环节距延迟模块;以及
图2A和2B图示了根据本发明一个实施例用于在编码器中执行开环 节距分析算法的流程图

具体实施方式

虽然关于具体实施例描述本发明,但是如这里所附权利要求限定的本 发明原理显然可以超出这里描述的本发明的具体所述实施例加以应用。例 如,虽然结合G.729建议书的编码器来描述本发明的各种实施例,但是本 申请的发明不限于特定标准而可以运用于任何系统中。另外在本发明的描 述中已经省略某些细节以免使本发明的发明方面变得不清楚。省略的细节 在本领域普通技术人员的知识内。
在本申请中的附图及其附带具体描述仅涉及本发明的例子实施例。为 了保持简洁,运用本发明原理的本发明其它实施例在本申请中没有具体加 以描述也没有用当前附图具体加以图示。应当了然于心的是,除非另有指 明,图中相似或者对应单元可以用相似或者对应标号来表示。
图2A和2B图示了根据本发明一个实施例用于在由控制器操作的比如 G.729建议书的编码器这样的编码器中执行开环节距分析(PLPA)算法 200的流程图。在一个实施例中,本发明的OLPA算法200提供一种通过 利用来自一个或者多个先前帧的整音(voicing)信息来改进常规算法的平 滑开环节距跟踪。
如图所示,OLPA算法200始于步骤205,在该步骤中初始开环节距 分析获得来自多个搜索范围的多个开环节距候选,比如来自三(3)个搜索 范围的三(3)个开环节距候选如下:
{p_max1,max1},{p_max2,max2},{p_max3,max3},
其中p_max1、p_max2和p_max3表示开环节距候选,而max1、max2和 max3表示用于开环节距候选的对应长期节距相关值,以及其中 p_max1>p_max2>p_max3。在一个实施例中,搜索算法相互排斥。
接着在步骤210,OLPA算法200在开环节距候选之中选择具有最大 节距长期节距相关值中最大值即max=MAX{max1,max2,max3}的开环节距候选, 其中max表示最大节距长期节距相关值的最大值,而p_max表示与max 对应的开环节距候选。例如,如果max2具有较max1和max3而言最大的 节距长期节距相关值,则p_max初始将设置为p_max2。
随后在步骤215-245,OLPA算法200执行下文进一步描述的以下操 作。
如果p_max2      如果(|pit_old-p_max2|<10)         步骤225
          thresh=0.7;                 步骤235
      否则
          thresh=0.9;                 步骤230
      如果(max*thresh                max-max2;              步骤245
                p_max=p_max2;         步骤245
      }
                                        状态220
在步骤215,OLPA算法200确定是否p_max2小于p_max。如果是这 样,则OLPA算法200移到步骤225,否则OLPA算法200移到状态220。 在步骤225,OLPA算法200确定小于p_max2小的先前节距是否小于预定 值,例如小于p_max2小的先前节距的绝对值是否小于10。如上所言,与 常规方式不同,OLPA算法200使用来自一个或者多个先前帧的信息。例 如在步骤225,先前帧如紧邻前一帧的节距信息在OLPA算法200中用于 提供平滑开环节距跟踪。在其它实施例中,先前帧的数个节距值、除紧邻 前一帧之外的先前帧的一个节距值或者来自先前帧的其它信息可以用于平 滑开环节距跟踪。回到步骤225,如果小于p_max2小的先前节距小于预定 值,则OLPA算法200进行到将阈值设置为预定值如0.7的步骤235。否 则OLPA算法200进行到将阈值设置为不同预定值如0.9的步骤230。在 任一情况下,在步骤230和235之后OLPA算法200移到步骤240,在该 步骤中确定与在步骤230或者235确定的阈值相乘的max是否小于max2。 如果不是,则OLPA算法200移到下文描述的状态220。否则OLPA算法 200移到步骤245,在该步骤中max接收的max2值而p_max接收p_max2 的值。在步骤245,OLPA算法200进一步移到下文描述的状态220。
就状态220而言,它是在步骤250-280执行的过程的开始状态,在该 状态下OLPA算法200执行下文进一步描述的以下操作。
如果p_max3         如果(|pit_old-p_max3|<5)          步骤260
               thresh=0.7;               步骤270
         否则
               thresh=0.9;               步骤265
         如果(max*thresh                p_max=p_max3;            步骤280
         }
                                           步骤255
OLPA算法200从状态220进行到步骤250,在该步骤中OLPA算法 200确定p_max3是否p_max。如果是这样,则OLPA算法200移到步骤 260,否则OLPA算法200移到状态255。在步骤260,OLPA算法200确 定小于p_max3小的先前节距是否小于预定值,例如小于p_max3小的先前 节距的绝对值是否小于5。如上所言,与常规方式不同,OLPA算法200 使用来自一个或者多个先前帧的信息。例如在步骤260,先前帧如紧邻前 一帧的节距信息在OLPA算法200中用于提供平滑开环节距跟踪。在其它 实施例中,先前帧的数个节距值、除紧邻前一帧之外的先前帧的一个节距 值或者来自先前帧的其它信息可以用于平滑开环节距跟踪。回到步骤260, 如果小于p_max3小的先前节距小于预定值,则OLPA算法200进行到将 阈值设置为预定值如0.7的步骤270。否则OLPA算法200进行到将阈值 设置为不同预定值如0.9的步骤265。在任一情况下,在步骤265和270 之后OLPA算法200移到步骤275,在该步骤中确定与在步骤265和270 确定的阈值相乘的max是否小于max3。如果不是,则OLPA算法200移 到下文描述的状态255。否则OLPA算法200移到步骤280,在该步骤中 p_max接收p_max3的值。换而言之,这时选择p_max3作为开环节距。在 步骤280,OLPA算法200进一步移到下文描述的状态255。
在步骤255,OLPA算法200结束,并且当前值p_max表示所选开环 节距的值而max表示用于p_max的对应长期节距相关值。
从本发明的以上描述中不言而喻,各种技术可以用于实施本发明的概 念而不脱离本发明的范围。另外尽管已经参照某些实施例描述了本发明, 但是本领域技术人员将认识到可以在形式和细节上做出改变而不脱离本发 明的精神和范围。例如设想可以用软件实施这里公开的电路或者反之亦然。 描述的实施例在所有方面都被认为是举例说明而不是进行限制。也应当理 解本发明不限于这里描述的特定实施例而是能够有许多重新布置、修改和 替换却不脱离本发明的范围。
相关申请
本申请基于通过援引整体结合于此的、申请日为2006年3月20日的 美国临时申请第60/784,384号,并且要求该临时申请的优先权。
相关专利内容
标题 发布/更新时间 阅读量
绞线机节距控制机构 2020-05-11 50
一种可变节距伸缩夹爪 2020-05-11 519
可变节距进料输送机构 2020-05-11 595
可变节距睫毛膏刷 2020-05-13 321
多节距球栅阵列 2020-05-11 659
束线机节距调节装置 2020-05-12 647
短节距薄型LED引线框架 2020-05-12 777
一种双节距变节距齿形输送链条 2020-05-11 625
节距摆动机构 2020-05-11 807
风力节距调整系统 2020-05-13 175
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈