专利汇可以提供基于心理声学模型的语音后置感知滤波器专利检索,专利查询,专利分析的服务。并且本 发明 涉及基于心理 声学模型 的语音后置 感知 滤波器 ,首先,该感知滤波器不需要融合在各个 算法 中,因而不会影响算法的复杂度,但是却获得了同样增强听觉感知度的效果。其次,它只是针对增强语音的再次处理的过程,使得增强语音的听觉感知度进一步的提高,即使噪声存在, 信噪比 没有提高的情况下,利用这个后置的感知滤波器,也能达到提高听觉感知度的目的;该后置感知滤波器是建立在语音 信号 失真最小的情况下使残留噪声尽可能不被人 耳 听到的条件下,且滤波器的增益是由在该条件下构建含有掩蔽 阈值 的代价函数获得,并由掩蔽阈值构建的感知归一化因子进一步优化,目的是避免了过度的削弱信号,保证了增强后语音感知失真最小。,下面是基于心理声学模型的语音后置感知滤波器专利的具体信息内容。
1.基于心理声学模型的语音后置感知滤波器,其特征在于:
在所述滤波器中,
1)带噪语音经过连续可导的谱减法增强后,根据心理声学模型分帧计算每帧的掩蔽阈值;
2)用第1)步求解的掩蔽阈值构建代价函数:
J=P(εs)+μ(P(εr)-E[Tk])
=|G-1|2E[|Sk|2]+μ(|G|2E[|Nk|2]-E[Tk])
其中,Sk为带噪语音中的纯净语音信号经傅里叶变换后的第k个频谱分量;Nk为带噪语音中的噪声信号经傅里叶变换后的第k个频谱分量,且E[|Nk|2]=λk;G代表每个子带中统一的感知滤波器的增益;μ为拉格朗日算子;Tk为第k个掩蔽阈值分量,代表的意思是能量大于Tk,人耳能听到声音,否则,将听不到;εs=Sk(G-1)为语音失真;εr=NkG为残留噪声;因为语音和噪声不相关,且噪声均值为0,所以E(NkSk)=0,则语音失真的功率可以表示为P(εs)=|G-1|2E[|Sk|2]、残留噪声的功率可以表示为P(εr)=|G|2E[|Nk|2]。
3)通过使代价函数最小,意味着在保证语音失真最小的情况下,每个子带中的残留噪声尽可能被纯净语音掩蔽,使人耳感受不到,以此来设计感知滤波器,即求解感知滤波器的增益。
4)再用感知归一化因子对感知滤波器进行修正,感知归一化因子为:
其中,Tmin(l)为第1帧中的最小值,Tmax(l)为第1帧中的最大值,得到最
终的感知滤波器的增益Gk为:
5)最后得到增强的语音。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
波轮洗衣机泡沫快速去除方法 | 2020-05-11 | 633 |
微波炉的温度感知结构 | 2020-05-13 | 254 |
一种全向感知仿生应变传感器及其制备方法 | 2020-05-17 | 582 |
电子装置及其相机模块 | 2020-05-14 | 54 |
无线图像通信系统的错误帧跳跃方法及装置 | 2020-05-20 | 219 |
衣物干燥度的感知方法及设备 | 2020-05-15 | 710 |
一种神经内科触觉感知诊断装置 | 2020-05-14 | 541 |
一种具有程控功能的可充电的植入式自动调压分流系统 | 2020-05-22 | 134 |
基于多传感器的灵巧手拮抗式控制系统 | 2020-05-26 | 381 |
基于用户感知的导航提醒方法以及装置 | 2020-05-15 | 72 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。