一种采用倒谱进行修正的语音增强方法及系统专利检索-帧图形技术专利检索查询-专利查询网

一种采用倒谱进行修正的语音增强方法及系统

阅读：62发布：2024-02-05

专利汇可以提供一种采用倒谱进行修正的语音增强方法及系统专利检索，专利查询，专利分析的服务。并且本发明提供一种采用倒谱进行修正的语音增强方法及系统。所述采用倒谱进行修正的语音增强方法包括：对输入的带噪语音信号进行分帧处理；计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与设定的倒谱门限值判断得到当前帧是否存在浊音信号的浊音判断结果；根据所述浊音判断结果对噪声估计或语音增强进行修正补偿。这样可以在一定程度上回复信噪比较差时的语音谐波分量，使语音增强处理后信号更丰满，提高降噪后音质。，下面是一种采用倒谱进行修正的语音增强方法及系统专利的具体信息内容。

权利要求

1.一种采用倒谱进行修正的语音增强方法，其特征在于，所述采用倒谱进行修正的语音增强方法包括：
对输入的带噪语音信号进行分帧处理；
计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与设定的倒谱门限值判断得到当前帧是否存在浊音信号的浊音判断结果，并将所述浊音判断结果加入到倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果；
将当前帧信号划分成K个频域子带，分别计算各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；将所述频域子带功率谱P(k)作为噪声估计MCRA 算法的输入，在长度为M的噪声估计子窗进行最小值跟踪计算，根据计算得到的最小值计算条件有音概率；根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正得到先验条件有音概率；根据所述先验条件有音概率计算噪声谱N(k)；
根据所述频域子带功率谱P(k)以及噪声谱N(k)对当前帧信号进行语音增强得到最终的输出信号。
2.根据权利要求1所述的采用倒谱进行修正的语音增强方法，其特征在于：计算噪声谱N(k)的具体实现方法包括：根据所述先验条件有音概率递归平均估计得到噪声谱N(k)。
3.根据权利要求1所述的采用倒谱进行修正的语音增强方法，其特征在于：根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述条件有音概率进行修正。
4.一种采用倒谱进行修正的语音增强系统，其特征在于：所述采用倒谱进行修正的语音增强系统包括：
信号分帧处理模块，用于对输入的带噪语音信号进行分帧处理；
浊音概率统计模块，用于计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与倒谱门限值判断得到当前帧是否存在浊音信号的的浊音判断结果，并将所述浊音判断结果加入到所述倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果；
噪声估计修正模块，用于将当前帧信号划分成K个频域子带，计算各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；将所述频域子带功率谱P(k)作为噪声估计MCRA算法的输入，在长度为M的噪声估计子窗进行最小值跟踪计算，根据计算得到的最小值计算条件有音概率；根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正得到先验条件有音概率；根据所述先验条件有音概率计算噪声谱N(k)；
语音增强处理模块，用于根据所述频域子带功率谱P(k)以及噪声谱N(k)对当前帧信号进行语音增强得到最终的输出信号。
5.根据权利要求4所述的采用倒谱进行修正的语音增强系统，其特征在于：计算噪声谱N(k)的具体实现方法包括：根据所述先验条件有音概率递归平均估计得到噪声谱N(k)。
6.根据权利要求4所述的采用倒谱进行修正的语音增强系统，其特征在于：根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述条件有音概率进行修正。
7.一种采用倒谱进行修正的语音增强方法，其特征在于：所述采用倒谱进行修正的语音增强方法包括：
对输入的带噪语音信号进行分帧处理；
计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与倒谱门限值判断得到当前帧是否存在浊音信号的的的浊音判断结果，并将所述浊音判断结果加入到所述倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果；
将当前帧信号划分成K个频域子带，计算得到当前帧信号的各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；根据所述频域子带功率谱P(k)进行噪声估计，得到噪声谱N(k)；
根据所述频域子带功率谱P(k)以及噪声谱N(k)估算出先验有音概率；根据所述倒谱记录窗口记录的浊音判断结果对所述先验有音概率进行修正，并对修正过程进行频域加权；
根据修正后的先验有音概率计算增益函数G(k)，根据所述增益函数G(k)得到最终的输出信号。
8.根据权利要求7所述的采用倒谱进行修正的语音增强方法，其特征在于：估算出先验有音概率的具体实现包括：根据所述频域子带功率谱P(k)以及噪声谱N(k)进行先验信噪比估算；对先验信噪比的时域进行平滑处理；对先验信噪比的频域全局以及局部进行平滑处理；最后根据所述先验信噪比估算出所述先验有音概率。
9.根据权利要求7所述的采用倒谱进行修正的语音增强方法，其特征在于：计算噪声谱N(k)的具体实现方法包括：最小统计量控制递归平均方法。
10.根据权利要求7所述的采用倒谱进行修正的语音增强方法，其特征在于：根据所述倒谱记录窗口记录的浊音判断结果对所述先验有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述先验有音概率进行修正。
11.一种采用倒谱进行修正的语音增强系统，其特征在于：所述采用倒谱进行修正的语音增强系统包括：
信号分帧处理模块，用于对输入的带噪语音信号进行分帧处理；
浊音概率统计模块，用于计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与倒谱门限值判断得到当前帧的浊音判断结果，并将所述浊音判断结果加入到所述倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果；
噪声估计处理模块，用于将当前帧信号的划分成K个频域子带，计算得到各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；根据所述频域子带功率谱P(k)进行噪声估计，得到噪声谱N(k)；
语音增强修正模块，用于根据所述频域子带功率谱P(k)以及噪声谱N(k)估算出先验有音概率，对所述倒谱记录窗口记录的浊音判断结果进行频域加权后，对所述先验有音概率进行修正；根据修正后的先验有音概率计算增益函数G(k)，根据所述增益函数G(k)得到最终的输出信号。
12.根据权利要求11所述的采用倒谱进行修正的语音增强系统，其特征在于：计算噪声谱N(k)的具体实现方法包括：最小统计量控制递归平均方法。
13.根据权利要求11所述的采用倒谱进行修正的语音增强系统，其特征在于：估算出先验有音概率的具体实现包括：根据所述频域子带功率谱P(k)以及噪声谱N(k)进行先验信噪比估算；对先验信噪比的时域进行平滑处理；对先验信噪比的频域全局以及局部进行平滑处理；最后根据所述先验信噪比估算出所述先验有音概率。
14.根据权利要求11所述的采用倒谱进行修正的语音增强系统，其特征在于：根据所述倒谱记录窗口记录的浊音判断结果对所述先验有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述先验有音概率进行修正。

说明书全文

一种采用倒谱进行修正的语音增强方法及系统

技术领域

[0001] 本发明涉及一种语音处理技术，特别是涉及一种采用倒谱进行修正的语音增强方法及系统。

背景技术

[0002] 在实际进行语音传输时，语音信号很难避免来自外界噪声的干扰。这些噪声的存在使得原本纯净的语音信号受到不同程度、随机的污染。许多语音处理系统性能的急剧恶化很大程度上都是因为噪声降低了语音质量。语音增强正是为了减少背景噪声对语音信号处理的影响，从带噪语音中获得尽可能纯净的语音信号而发展起来的一种语音处理技术。语音增强通常包括噪声功率谱估计和语音增强两部分。目前国内外应用较广的噪声估计方法为MCRA (Minima Controlled Recursive Averaging，最小统计量控制递归平均)方法或基于其进行改进的算法，该方法在语音段和纯噪声段都进行噪声估计更新，可一定程度上跟踪非平稳噪声的噪声。MCRA方法采用递归平均进行噪声估计，平滑参数受语音存在概率控制，并由最小统计量控制语音存在概率。但该噪声跟踪算法存在一个问题，在语音持续时间较长或选择窗长较短的情况下，噪声功率谱会出现过估计现象。语音增强目前多采用最佳修正短时对数谱估计算法，它是结合了语音存在概率修正对数MMSE估计器，但是该算法无法避免噪声过估计导致的语音失真。由于分频率进行噪声估计，计算量较大，且频谱会有细条状能量集中带出现，因此采用子带方法进行语音增强处理。但是采用子带后，当某些子带信噪比较低时，会导致整个频带语音估计变弱或消失，使语音失真更严重。

[0003] 鉴于此，如何找到在语音传输中更有效处理语音信号的语音增强方案就成了本领域技术人员亟待解决的问题。

发明内容

[0004] 鉴于以上所述现有技术的缺点，本发明的目的在于提供一种采用倒谱进行修正的语音增强方法及系统，用于解决现有技术中处理语音信号时导致的语音失真等问题。

[0005] 为实现上述目的及其他相关目的，本发明提供一种采用倒谱进行修正的语音增强方法，所述采用倒谱进行修正的语音增强方法包括：对输入的带噪语音信号进行分帧处理；计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与设定的倒谱门限值判断得到当前帧是否存在浊音信号的浊音判断结果，并将所述浊音判断结果加入到倒谱记录窗口中；
所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果；
将当前帧信号划分成K个频域子带，分别计算各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；将所述频域子带功率谱P(k)作为噪声估计MCRA算法的输入，在长度为M的噪声估计子窗进行最小值跟踪计算，根据计算得到的最小值计算条件有音概率；根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正得到先验条件有音概率；根据所述先验条件有音概率计算噪声谱N(k)；根据所述频域子带功率谱P(k) 以及噪声谱N(k)对当前帧信号进行语音增强得到最终的输出信号。

[0006] 可选地，计算噪声谱N(k)的具体实现方法包括：根据所述先验条件有音概率递归平均估计得到噪声谱N(k)。

[0007] 可选地，根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述条件有音概率进行修正。

[0008] 本发明还提供一种采用倒谱进行修正的语音增强系统，所述采用倒谱进行修正的语音增强系统包括：信号分帧处理模块，用于对输入的带噪语音信号进行分帧处理；浊音概率统计模块，用于计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与倒谱门限值判断得到当前帧是否存在浊音信号的的浊音判断结果，并将所述浊音判断结果加入到所述倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果；噪声估计修正模块，用于将当前帧信号划分成K个频域子带，计算各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；将所述频域子带功率谱P(k)作为噪声估计MCRA算法的输入，在长度为M的噪声估计子窗进行最小值跟踪计算，根据计算得到的最小值计算条件有音概率；根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正得到先验条件有音概率；根据所述先验条件有音概率计算噪声谱N(k)；语音增强处理模块，用于根据所述频域子带功率谱P(k)以及噪声谱N(k)对当前帧信号进行语音增强得到最终的输出信号。

[0009] 可选地，计算噪声谱N(k)的具体实现方法包括：根据所述先验条件有音概率递归平均估计得到噪声谱N(k)。

[0010] 可选地，根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述条件有音概率进行修正。

[0011] 本发明提供一种采用倒谱进行修正的语音增强方法，所述采用倒谱进行修正的语音增强方法包括：对输入的带噪语音信号进行分帧处理；计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与倒谱门限值判断得到当前帧是否存在浊音信号的浊音判断结果，并将所述浊音判断结果加入到所述倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果；将当前帧信号划分成K个频域子带，计算得到当前帧信号的各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k 为频域子带索引；根据所述频域子带功率谱P(k)进行噪声估计，得到噪声谱N(k)；根据所述频域子带功率谱P(k)以及噪声谱N(k)估算出先验有音概率；根据所述倒谱记录窗口记录的浊音判断结果对所述先验有音概率进行修正，并对修正过程进行频域加权；根据修正后的先验有音概率计算增益函数G(k)，根据所述增益函数G(k)得到最终的输出信号。

[0012] 可选地，估算出先验有音概率的具体实现包括：根据所述频域子带功率谱P(k)以及噪声谱N(k)进行先验信噪比估算；对先验信噪比的时域进行平滑处理；对先验信噪比的频域全局以及局部进行平滑处理；最后根据所述先验信噪比估算出所述先验有音概率。

[0013] 可选地，计算噪声谱N(k)的具体实现方法包括：最小统计量控制递归平均方法。

[0014] 可选地，根据所述倒谱记录窗口记录的浊音判断结果对所述先验有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述先验有音概率进行修正。

[0015] 本发明还提供一种采用倒谱进行修正的语音增强系统，所述采用倒谱进行修正的语音增强系统包括：信号分帧处理模块，用于对输入的带噪语音信号进行分帧处理；浊音概率统计模块，用于计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与倒谱门限值判断得到当前帧的浊音判断结果，并将所述浊音判断结果加入到所述倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果；噪声估计处理模块，用于将当前帧信号的划分成K个频域子带，计算得到各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；根据所述频域子带功率谱P(k) 进行噪声估计，得到噪声谱N(k)；语音增强修正模块，用于根据所述频域子带功率谱P(k)以及噪声谱N(k)估算出先验有音概率，对所述倒谱记录窗口记录的浊音判断结果进行频域加权后，对所述先验有音概率进行修正；根据修正后的先验有音概率计算增益函数G(k)，根据所述增益函数G(k)得到最终的输出信号。

[0016] 可选地，计算噪声谱N(k)的具体实现方法包括：最小统计量控制递归平均方法。

[0017] 可选地，估算出先验有音概率的具体实现包括：根据所述频域子带功率谱P(k)以及噪声谱N(k)进行先验信噪比估算；对先验信噪比的时域进行平滑处理；对先验信噪比的频域全局以及局部进行平滑处理；最后根据所述先验信噪比估算出所述先验有音概率。

[0018] 可选地，根据所述倒谱记录窗口记录的浊音判断结果对所述先验有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述先验有音概率进行修正。

[0019] 如上所述，本发明的一种采用倒谱进行修正的语音增强方法及系统，具有以下有益效果：通过对输入带噪语音信号进行倒谱估计，根据估计得到的倒谱系数判断是否存在浊音谐频信号。根据浊音判断结果对噪声估计或语音增强进行修正补偿。这样可以更好的保留语音信号，从而避免或减轻语音失真。附图说明

[0020] 图1显示为本发明的一种采用倒谱进行修正的语音增强方法的一实施例的流程示意图。

[0021] 图2显示为本发明的一种采用倒谱进行修正的语音增强方法的另一实施例的流程示意图。

[0022] 图3显示为本发明的一种采用倒谱进行修正的语音增强系统的一实施例的模块示意图。

[0023] 图4显示为本发明的另一种采用倒谱进行修正的语音增强方法的一实施例的流程示意图。

[0024] 图5显示为本发明的另一种采用倒谱进行修正的语音增强方法的另一实施例的流程示意图。

[0025] 图6显示为本发明的另一种采用倒谱进行修正的语音增强系统的一实施例的模块示意图。

[0026] 元件标号说明

[0027] 1 采用倒谱进行修正的语音增强系统

[0028] 11 浊音概率统计模块

[0029] 12 信号分帧处理模块

[0030] 13 噪声估计修正模块

[0031] 14 语音增强处理模块

[0032] 15 噪声估计处理模块

[0033] 16 语音增强修正模块

[0034] S11～S14 步骤

[0035] S21～S24 步骤

具体实施方式

[0036] 以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。

[0037] 需要说明的是，本实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

[0038] 本发明提供一种采用倒谱进行修正的语音增强方法。在一个实施例中，如图1所示，所述采用倒谱进行修正的语音增强方法包括：

[0039] 步骤S11，对输入的带噪语音信号进行分帧处理。

[0040] 步骤S12，计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与设定的倒谱门限值判断得到当前帧是否存在浊音信号的浊音判断结果，并将所述浊音判断结果加入到倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果。

[0041] 步骤S13，将当前帧信号划分成K个频域子带，分别计算各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；将所述频域子带功率谱P(k) 作为噪声估计MCRA算法的输入，在长度为M的噪声估计子窗进行最小值跟踪计算，根据计算得到的最小值计算条件有音概率；根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正得到先验条件有音概率；根据所述先验条件有音概率计算噪声谱N(k)。在一个实施例中，根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述条件有音概率进行修正。在一个实施例中，计算噪声谱N(k)的具体实现方法包括：根据所述先验条件有音概率递归平均估计得到噪声谱N(k)。

[0042] 步骤S14，根据所述频域子带功率谱P(k)以及噪声谱N(k)对当前帧信号进行语音增强得到最终的输出信号。

[0043] 在一个实施例中，如图2示，所述采用倒谱进行修正的语音增强方法包括：

[0044] (1)采用经过分帧处理的原始输入带噪语音信号x计算倒谱系数c，c(q)＝ IFFT{ln(|X(k)|2)，其中X为信号x的频域表示。IFFT(Inverse Fast Fourier Transform)为快速傅里叶逆变换。

[0045] (2)设置倒谱系数门限值cth为0.4(倒谱门限值)，搜索倒谱系数的最大值c(qmax)与 cth进行比较。qmax＝argmax{c(q)}，其中q的搜索范围定为70Hz～300Hz。argmax表示寻找具有最大评分的参量。

[0046] 如果c(qmax)>cth,判断该帧存在浊音信号，并记录于长度为N＝25的子窗中，记Ix(n)＝1，否则记Ix(n)＝0，n为循环记录当前子窗序号。统计浊音存在概率，并结合子窗M、N判断浊音分布情况。

[0047] (3)将带噪语音信号划分为24个子带，计算子带信号频域功率谱P(k)。

[0048] (4)采用现有噪声估计算法MCRA算法进行噪声估计，对噪声谱频谱平滑后，在长度为M＝3×4的子窗内进行最小值跟踪计算S(k)，进而计算条件有音概率p。

[0049] (5)结合倒谱系数分析对子带2～21的条件有音概率p(k)进行修正(即对较高和较低频段不进行修正)，记为pc(k)。

[0050] 首先，判断当前帧的Ix值，若Ix为0，则pc＝p；否则继续进行判断。

[0051] 当前帧及前M-1帧中Ix为1的概率p1，如果p1<0.7，则pc＝p；否则继续进行判断。

[0052] N帧长度的子窗中Ix为1的概率p2，如果p1<0.5，则pc＝p；否则对p进行修正得到pc。此处简单分两段进行修正如下：

[0053] 若p(k)<(pmax-0.2)

[0054] pc(k)＝p(k)+(pmax-p(k))×0.8；

[0055] 否则

[0056] pc(k)＝p(k)；

[0057] 其中，pmax＝max(p(k))。

[0058] (6)利用修正后有音概率pc替代修正前条件有音概率p递归平均估计噪声谱N(k)。

[0059] (7)利用估计噪声功率谱N(k)和输入子带功率谱P(k)，采用现有语音增强算法MMSE (Minimum Mean Squared Erro，最小均方误差)估计器进行语音增强计算，得到子带增益 Gband，进行子带逆运算得到线性增益G。

[0060] (8)输出处理后频域信号Y(k)＝G(k)X(k)，进行IFFT运算即可得到时域输出信号y(最终的输出信号)。

[0061] 本发明还提供一种采用倒谱进行修正的语音增强系统，所述采用倒谱进行修正的语音增强系统可以采用如上所述的采用倒谱进行修正的语音增强方法。在一个实施例中，如图3示，所述采用倒谱进行修正的语音增强系统1包括：

[0062] 信号分帧处理模块11用于对输入的带噪语音信号进行分帧处理。

[0063] 浊音概率统计模块12与信号分帧处理模块11相连，用于计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与倒谱门限值判断得到当前帧是否存在浊音信号的的浊音判断结果，并将所述浊音判断结果加入到所述倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果。

[0064] 噪声估计修正模块13与浊音概率统计模块12及信号分帧处理模块11相连，用于将当前帧信号划分成K个频域子带，计算各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；将所述频域子带功率谱P(k)作为噪声估计MCRA算法的输入，在长度为M的噪声估计子窗进行最小值跟踪计算，根据计算得到的最小值计算条件有音概率；根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正得到先验条件有音概率；根据所述先验条件有音概率计算噪声谱N(k)。在一个实施例中，根据所述倒谱记录窗口记录的浊音判断结果对所述条件有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述条件有音概率进行修正。在一个实施例中，计算噪声谱N(k)的具体实现方法包括：根据所述先验条件有音概率递归平均估计得到噪声谱N(k)。

[0065] 语音增强处理模块14与噪声估计修正模块13相连，用于根据所述频域子带功率谱P(k) 以及噪声谱N(k)对当前帧信号进行语音增强得到最终的输出信号。

[0066] 本发明提供一种采用倒谱进行修正的语音增强方法。在一个实施例中，如图4所示，所述采用倒谱进行修正的语音增强方法包括：

[0067] 步骤S21，对输入的带噪语音信号进行分帧处理。

[0068] 步骤S22，计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与倒谱门限值判断得到当前帧是否存在浊音信号的的的浊音判断结果，并将所述浊音判断结果加入到所述倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果。

[0069] 步骤S23，将当前帧信号划分成K个频域子带，计算得到当前帧信号的各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；根据所述频域子带功率谱P(k)进行噪声估计，得到噪声谱N(k)。在一个实施例中，计算噪声谱N(k)的具体实现方法包括：最小统计量控制递归平均方法。

[0070] 步骤S24，根据所述频域子带功率谱P(k)以及噪声谱N(k)估算出先验有音概率；根据所述倒谱记录窗口记录的浊音判断结果对所述先验有音概率进行修正，并对修正过程进行频域加权；根据修正后的先验有音概率计算增益函数G(k)，根据所述增益函数G(k)得到最终的输出信号。在一个实施例中，估算出先验有音概率的具体实现包括：根据所述频域子带功率谱 P(k)以及噪声谱N(k)进行先验信噪比估算；对先验信噪比的时域进行平滑处理；对先验信噪比的频域全局以及局部进行平滑处理；最后根据所述先验信噪比估算出所述先验有音概率。在一个实施例中，根据所述倒谱记录窗口记录的浊音判断结果对所述先验有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述先验有音概率进行修正。

[0071] 在一个实施例中，如图5所示，所述倒谱进行修正的语音增强方法包括：

[0072] (1)对带噪语音信号进行分帧处理，采用未进行子带合并前(即划分子带前)输入数据计算倒谱系数c。

[0073] (2)根据设置的门限cth，判断该帧是否为浊音信号，并将判断结果记录于长度为N＝25 的子窗中，记为Ix(n)。统计浊音存在概率(即有音/无音概率)，并进行频域加权。

[0074] (3)采用现有噪声估计算法MCRA估计噪声功率谱N(k)，计算输入信号子带功率谱P(k)。

[0075] (4)采用现有语音增强算法MMSE进行语音增强运算。首先计算先验性噪比并进行时域平滑；接着通过局部和全局频域平滑估算先验有音概率p(k)。

[0076] (5)根据倒谱系数分析对子带2～21的先验有音概率p(k)进行修正，记为pc(k)。(因为未知环境噪声情况，因此此处不具体进行频域加权处理，仅对高频段和低频段先验有音概率不进行修正)。

[0077] (6)根据有音/无音概率计算子带增益Gband，进行子带逆运算得到线性增益G。

[0078] (7)输出处理后频域信号Y(k)＝G(k)X(k)，进行IFFT运算即可得到时域输出信号y(最终的输出信号)。

[0079] 该方法中的对子带划分以及倒谱系数的处理和修正原理可以与前述实例中相同。

[0080] 本发明还提供一种采用倒谱进行修正的语音增强系统，所述采用倒谱进行修正的语音增强系统可以采用如上所述的采用倒谱进行修正的语音增强方法。在一个实施例中，如图6示，所述采用倒谱进行修正的语音增强系统包括：

[0081] 信号分帧处理模块11用于对输入的带噪语音信号进行分帧处理。

[0082] 浊音概率统计模块12，用于计算当前帧信号的倒谱系数，根据当前帧信号的倒谱系数与倒谱门限值判断得到当前帧的浊音判断结果，并将所述浊音判断结果加入到所述倒谱记录窗口中；所述倒谱记录窗口的长度为N，所述倒谱记录窗口记录当前帧及前N-1帧的浊音判断结果。在一个实施例中，计算噪声谱N(k)的具体实现方法包括：最小统计量控制递归平均方法。

[0083] 噪声估计处理模块15与浊音概率统计模块12及信号分帧处理模块11相连，用于将当前帧信号的划分成K个频域子带，计算得到各频域子带功率，根据所有的所述频域子带功率得到频域子带功率谱P(k)，k为频域子带索引；根据所述频域子带功率谱P(k)进行噪声估计，得到噪声谱N(k)。

[0084] 语音增强修正模块16与噪声估计处理模块15相连，用于根据所述频域子带功率谱P(k) 以及噪声谱N(k)估算出先验有音概率，对所述倒谱记录窗口记录的浊音判断结果进行频域加权后，对所述先验有音概率进行修正；根据修正后的先验有音概率计算增益函数G(k)，根据所述增益函数G(k)得到最终的输出信号。在一个实施例中，估算出先验有音概率的具体实现包括：根据所述频域子带功率谱P(k)以及噪声谱N(k)进行先验信噪比估算；对先验信噪比的时域进行平滑处理；对先验信噪比的频域全局以及局部进行平滑处理；最后根据所述先验信噪比估算出所述先验有音概率。在一个实施例中，根据所述倒谱记录窗口记录的浊音判断结果对所述先验有音概率进行修正的具体实现包括：根据所述倒谱记录窗口记录的浊音存在位置分布和浊音存在概率对所述先验有音概率进行修正。

[0085] 本发明的采用倒谱进行修正的语音增强方案中，还可以根据语音特征及人耳对语音的听觉感知特性，结合子带划分计算不同频的修正系数。如果知道应用环境噪声频率分布情况或噪声特点，可将噪声特性引入对不同频带的修正系数计算中。

[0086] 综上所述，本发明一种采用倒谱进行修正的语音增强方法及系统通过采用倒谱系数对语音存在进行判断，根据判断结果对最终不同频带语音存在概率进行修正。这样可以在一定程度上回复信噪比较差时的语音谐波分量，使语音增强处理后信号更丰满，提高降噪后音质。不仅如此，采用本发明后，语音增强算法可选择较小的子窗长度，可更好的估计非平稳噪声，提高降噪效果。并且本发明方法增加的运算量很小，有利于实际应用。所以，本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

[0087] 上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

标题	发布/更新时间	阅读量
一种声音采集对象声纹检测方法、装置和设备	2020-05-08	323
视频传输控制方法及装置、设备、存储介质	2020-05-08	463
一种双路媒体流数据的播放方法及显示设备	2020-05-08	829
图像处理方法、装置、电子设备及可读存储介质	2020-05-11	993
视频水印的嵌入处理方法、装置、电子设备及存储介质	2020-05-08	727
视频处理装置和用于确定编码视频的运动元数据的方法	2020-05-08	501
基于单应性变换的视频融合方法、系统、终端及介质	2020-05-11	657
图像处理方法及装置、电子设备和计算机可读存储介质	2020-05-08	12
图像处理方法、装置、电子设备及计算机可读存储介质	2020-05-11	207
在经许可的频谱和未经许可的频谱上的并发的无线通信	2020-05-08	729

一种采用倒谱进行修正的语音增强方法及系统

一种采用倒谱进行修正的语音增强方法及系统

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：