首页 / 专利库 / 医疗设备 / 感知过度 / 基于心理声学模型的语音后置感知滤波器

基于心理声学模型的语音后置感知滤波器

阅读:233发布:2020-05-12

专利汇可以提供基于心理声学模型的语音后置感知滤波器专利检索,专利查询,专利分析的服务。并且本 发明 涉及基于心理 声学模型 的语音后置 感知 滤波器 ,首先,该感知滤波器不需要融合在各个 算法 中,因而不会影响算法的复杂度,但是却获得了同样增强听觉感知度的效果。其次,它只是针对增强语音的再次处理的过程,使得增强语音的听觉感知度进一步的提高,即使噪声存在, 信噪比 没有提高的情况下,利用这个后置的感知滤波器,也能达到提高听觉感知度的目的;该后置感知滤波器是建立在语音 信号 失真最小的情况下使残留噪声尽可能不被人 耳 听到的条件下,且滤波器的增益是由在该条件下构建含有掩蔽 阈值 的代价函数获得,并由掩蔽阈值构建的感知归一化因子进一步优化,目的是避免了过度的削弱信号,保证了增强后语音感知失真最小。,下面是基于心理声学模型的语音后置感知滤波器专利的具体信息内容。

1.基于心理声学模型的语音后置感知滤波器,其特征在于:
在所述滤波器中,
1)带噪语音经过连续可导的谱减法增强后,根据心理声学模型分计算每帧的掩蔽阈值
2)用第一步求解的掩蔽阈值构建代价函数:
2 2 2 2
J=P(εs)+μ(P(εr)-E[Tk])=|G-1|E[|Sk|]+μ(|G|E[|Nk|]-E[Tk])其中,εs=Sk(G-1)为语音失真,εr=NkG为残留噪声;E(NkSk)=0,语音失真的功率P(εs)、残留噪声的功率P(εr);
3)通过使代价函数最下,求解感知滤波器的增益;
4)再用感知归一化因子对感知滤波器进行修正,
感知归一化因子为: 其中,Tmin(l)为第1帧中的最小值,Tmax(l)为第1帧中的最大值,得到最终的感知滤波器的增益Gk为:
5)最后得到增强的语音。

说明书全文

基于心理声学模型的语音后置感知滤波器

技术领域

[0001] 本发明涉及基于心理声学模型的语音后置感知滤波器。

背景技术

[0002] 目前,语音增强的各种算法都能不同程度地去除噪声,但是或多或少还存在残留噪声和音乐噪声,影响了语音的质量,所以需要进一步消除它;再加上对语音的评价最终依赖于人的听觉感受,因而对语音增强的研究应结合运用人类听觉系统对语音的感知特性,即人的掩蔽效应,对不需要的噪声有特殊抑制功能,使增强后的语音尽可能地降低听觉疲劳度、改善听觉感受性,起到提高语音质量的效能。所以,结合人耳听觉特性中的掩蔽效应对语音增强的性能有着非常重要的作用。
[0003] 近年来,有许多专家学者对基于人耳掩蔽效应的语音增强作了研究,并取得了一定的效果。但这些算法都是建立在同别的算法进行融合的基础上,使原本的算法因为加入了掩蔽模型的计算更加复杂,甚至不能实时实现。针对这个问题,本章提出了一种基于掩蔽效应的后置感知滤波器,并把它运用在语音增强中。

发明内容

[0004] 本发明针对增强后的语音存在残留噪声,导致听觉感知度差的问题,提出一种基于心理声学模型的后置感知滤波器,并把它运用在语音增强中。首先,该感知滤波器不需要融合在各个算法中,因而不会影响算法的复杂度,但是却获得了同样增强听觉感知度的效果。其次,它只是针对增强语音的再次处理的过程,使得增强语音的听觉感知度进一步的提高,即使噪声存在,信噪比没有提高的情况下,利用这个后置的感知滤波器,也能达到提高听觉感知度的目的;该后置感知滤波器是建立在语音信号失真最小的情况下使残留噪声尽可能不被人耳听到的条件下,且滤波器的增益是由在该条件下构建含有掩蔽阈值的代价函数获得,并由掩蔽阈值构建的感知归一化因子进一步优化,目的是避免了过度的削弱信号,保证了增强后语音感知失真最小。
[0005] 如图1所示,具体方案为:
[0006] 1)带噪语音经过谱减法(这个方法可以改变)增强后,根据心理声学模型分计算每帧的掩蔽阈值。
[0007] 2)用第一步求解的掩蔽阈值构建代价函数,目的是保证语音信号失真最小的条件下、使残留噪声尽可能不被人耳听到。
[0008] J=P(εs)+μ(P(εr)-E[Tk])=|G-1|2E[|Sk|]2+μ(|G|2E[|Nk|]2-E[Tk])[0009] 其中,εs=Sk(G-1)为语音失真,εr=NkG为残留噪声。因为语音和噪声不[0010] 相关,所以E(NkSk)=0,语音失真的功率P(εs)、残留噪声的功率P(εr)。
[0011] 3)通过使代价函数最下,求解感知滤波器的增益。
[0012] 4)为了避免过度的削弱信号,再用感知归一化因子对感知滤波器进行修正,避免了过度的削弱信号,保证了增强后语音感知失真最小。
[0013] 感知归一化因子为: 其中,Tmin(l)为第1帧中的最小值,Tmax(l)为第1帧中的最大值,得到最终的感知滤波器的增益Gk为:
[0014]
[0015] 5)最后得到增强的语音。附图说明
[0016] 通过参照附图更详细地描述本发明的示例性实施例,本发明的以上和其它方面及优点将变得更加易于清楚,在附图中:
[0017] 图1为本发明的基于心理声学模型的语音后置感知滤波器的原理图;
[0018] 图2为本发明的基于心理声学模型的语音后置感知滤波器的白噪声背景下,SS和WF加感知滤波器前后的结果比较示意图;
[0019] 图3为本发明的基于心理声学模型的语音后置感知滤波器的火车噪声背景下,SS和WF加感知滤波器前后的结果比较示意图。

具体实施方式

[0020] 在下文中,现在将参照附图更充分地描述本发明,在附图中示出了各种实施例。然而,本发明可以以许多不同的形式来实施,且不应该解释为局限于在此阐述的实施例。相反,提供这些实施例使得本公开将是彻底和完全的,并将本发明的范围充分地传达给本领域技术人员。
[0021] 在下文中,将参照附图更详细地描述本发明的示例性实施例。
[0022] 用MATLAB 对 用 谱 减 法 (Spectral Subtraction,SS) 和 维 纳 滤 波 法(WienerFiltering,WF)增强之后的语音加后置感知滤波器进行实验仿真,语音取自863语音库中的英文男声:“The birch canoe slid on the smooth planks.”,采样率为8kHz,帧长K为160,帧叠为50%;噪声为NOISEX.92数据库的高斯白噪声和火车噪声。在纯净语音中加入高斯白噪声和火车噪声作为带噪语音。其中加入高斯白噪声的带噪语音的信噪比为-10dB,-5dB,0dB,5dB,10dB;加入火车噪声的带噪语音的信噪比为0dB,5dB,10dB,15dB。仿真的目的是对谱减法和维纳滤波加后置感知滤波器前后的SNR(Signal Noise Ratio)和PESQ(Perceptual Evaluation Speech Quality)比较,实验结果如图2、3所示。
[0023] 从图2中可以看出,在白噪声背景下,谱减法和维纳滤波法加入感知滤波器后,信噪比有略微提高或者降低,但PESQ值却整体提高了,比如在10dB时。这正好印证了感知滤波器的设计思想,容许噪声存在,信噪比有所降低,但听觉感知度却提高了。另外,在图3中的火车噪声背景下情况基本相同,说明无论在什么噪声背景、什么语音增强算法之后,该设计符合感知滤波器的设计要求,符合人耳听觉的要求,同时也证明了新提出的感知滤波器的有效性,可以运用在语音增强中。
[0024] 以上所述仅为本发明的实施例而已,并不用于限制本发明。本发明可以有各种合适的更改和变化。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈