首页 / 专利库 / 电子零件及设备 / 带通滤波器 / 声音掩蔽器及声音掩蔽方法

声音掩蔽器及声音掩蔽方法

阅读:929发布:2020-05-08

专利汇可以提供声音掩蔽器及声音掩蔽方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种声音掩蔽器及声音掩蔽方法,所述声音掩蔽器包括:接收语音 信号 的主通道;接收背景信号的副通道;分 帧 单元;与所述分帧单元相连接的带通 滤波器 ;与所述 带通滤波 器 相连接的语音检测单元;与所述语音检测单元相连接的时变滤波器;与所述分帧单元相连接的掩蔽单元;与时变滤波器和掩蔽单元相连接的求和单元;本发明掩蔽结果好,灵活性高。,下面是声音掩蔽器及声音掩蔽方法专利的具体信息内容。

1.一种声音掩蔽器,其特征在于所述声音掩蔽器包括:
接收语音信号的主通道;
接收背景信号的副通道;
单元,用于将所述主通道上的信号进行分帧处理得到各帧主通道信号,以及将所述副通道上的信号进行分帧处理得到各帧副通道信号;
与所述分帧单元相连接的带通滤波器;所述带通滤波器用于将所述各帧主通道信号进行带通滤波;
与所述带通滤波器相连接的语音检测单元;所述语音检测单元用于对带通滤波后的各帧主通道信号为语音帧或噪声帧进行判断;
与所述语音检测单元相连接的时变滤波器;所述时变滤波器用于对进行语音帧或噪声帧判断后的各帧主通道信号进行时变带通滤波处理;
与所述分帧单元相连接的掩蔽单元;在所述时变滤波器对各帧主通道信号进行时变带通滤波处理的同时,所述掩蔽单元用于对各帧副通道信号进行掩蔽处理;当一帧主通道信号为语音帧时,所述时变滤波器的滤波带宽逐渐增大,同时所述掩蔽单元调整与该语音帧相对应的某帧副通道信号逐渐减小,当一帧主通道信号为噪声帧时,所述时变滤波器的滤波带宽逐渐减小,同时所述掩蔽单元调整与该噪声帧相对应的某帧副通道信号逐渐增大;
与时变滤波器和掩蔽单元相连接的求和单元;所述求和单元用于将经过时变带通滤波处理后的一帧主通道信号同经过掩蔽处理的与该帧主通道信号相对应的某帧副通道信号对应叠加得到一帧输出信号
2.根据权利要求1所述的声音掩蔽器,其特征在于
若进行带通滤波之前的一帧主通道信号在第n个采样点对应的采样值为in_x(n),则所述第n个采样点对应的采样值经过带通滤波器后的输出结果
其中,IIR_A(k)为第k个滤波
系数、IIR_B(r)为第r个滤波系数、当n≥k时,u(n-k)表示本帧主通道信号经带通滤波后第n-k个采样点对应的输出结果、当n3.根据权利要求1所述的声音掩蔽器,其特征在于所述语音检测单元包括:
功率计算模,用于计算出经过带通滤波器后的各帧主通道信号的功率;
与所述功率计算模块相连接的阈值获取模块;所述阈值获取模块用于根据功率计算模块计算出的经过带通滤波器后的各帧主通道信号的功率,来获得语音功率集合、噪声功率集合、以及语音和噪声的功率分界阈值;
与阈值获取模块相连接的Pn获知模块;所述Pn获知模块用于对噪声功率集合的各噪声功率在所述各帧主通道信号的功率中的概率分布进行求和,并当得到的和值大于第一预设值时将所述各噪声功率中的最大值定义为Pn;当Pn满足预设条件,以及所述语音功率集合中的各语音功率均值与所述噪声功率集合中各噪声功率均值之间满足预设关系时,所述Pn获知模块更新Pn,否则保持Pn不变;
与阈值获取模块和Pn获知模块相连接的判定模块;所述判定模块用于根据计算出的经过带通滤波器后的一帧主通道信号的功率与Pn的大小比较结果,来确定该帧主通道信号为语音帧或噪声帧。
4.根据权利要求3所述的声音掩蔽器,其特征在于所述功率计算模块通过公式来计算经过带通滤波后的一帧主通道信号的功
率,式中:Px表示经过带通滤波后的该帧主通道信号的功率、LEN表示主通道信号一帧长对应的采样点数、u(n)表示该帧主通道信号进行带通滤波后第n个采样点对应的采样值。
5.根据权利要求3所述的声音掩蔽器,其特征在于所述阈值获取模块获得语音功率集合、噪声功率集合、以及语音和噪声的功率分界阈值的具体过程为:
对功率计算模块计算出的预设帧数的各帧主通道信号的功率值各自出现的频度进行统计;
建立预设帧数的各帧主通道信号功率值的概率分布直方图,根据该概率分布直方图得到语音功率分布区域和噪声功率分布区域;
采用最大类间方差法计算语音和噪声的功率分界阈值。
6.根据权利要求5所述的声音掩蔽器,其特征在于设定语音功率分布区域内的语音功率集合为[0,Pth-1]、噪声功率分布区域内的噪声功率集合为[Pth,Pm],其中,Pth-1表示语音功率分布区域内的语音功率最小值、Pth表示噪声功率分布区域内的噪声功率最大值、Pm表示噪声功率分布区域内的噪声功率最小值;所述阈值获取模块采用最大类间方差法计算语音和噪声的功率分界阈值Pthbest的具体过程为:
通过公式 计算出语音功率集合中的各语音功率均值、通过公式
计算出噪声功率集合中各噪声功率均值,其中, uv
表示语音功率集合中的各语音功率均值、un表示噪声功率集合中各噪声功率均值、pi表示语音功率i的分布概率、pk表示语音功率k的分布概率、i依次取值为[0,Pth-1]的各值、k依次取值为[Pth,Pm]的各值;
利用公式uT=w0uv+w1un得出预设帧数的各帧主通道信号的平均功率,其中,uT表示预设帧数的各帧主通道信号的平均功率;
通过公式σ2=w0(uv-uT)2+w1(un-uT)2获得语音功率与噪声功率之间的类间方差,并得出使类间方差σ2取值最大的功率值,该功率值为语音和噪声的功率分界阈值Pthbest。
7.根据权利要求3所述的声音掩蔽器,其特征在于所述判定模块首先设定状态值VAD的初值为0;针对某帧主通道信号,当状态值VAD为0,同时该帧主通道信号的功率值Px比Pn大第二预设值,则所述判定模块判定该帧主通道信号为语音帧,并将状态值VAD更新为1,当状态值VAD为1,同时该帧主通道信号的功率值Px比Pn小第三预设值,则所述判定模块判定该帧主通道信号为噪声帧,并将状态值VAD更新为0。
8.根据权利要求1所述的声音掩蔽器,其特征在于,
所述时变滤波器的中心频率为0.8kHz、幅频响应
差分方程为
其中,r表
示带宽控制变量、变化范围为[0.005,0.995],具体地,当一帧主通道信号为语音帧时,带宽控制变量r由0.995按照步长step1变化至0.005,当一帧主通道信号为噪声帧时,带宽控制变量r由0.005按照步长step2变化至0.995,其中:fs表示采样频率、y(n)表示该帧主通道信号经时变带通滤波后第n个采样点对应的输出结果、y(n-1)表示上一帧主通道信号经时变带通滤波后倒数第1个采样点对应的输出结果、y(n-2)表示上一帧主通道信号经时变带通滤波后倒数第2个采样点对应的输出结果、j表示虚数单位,j2=-1、ω表示圆周频率,当一帧主通道信号为语音帧时,所述掩蔽单元调整与该语音帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐减小到该语音帧经过时变带通滤波后的功率的百分之一,当一帧主通道信号为噪声帧时,所述掩蔽单元调整与该噪声帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐增大到当前帧副通道信号的功率;所述掩蔽单元通过公式 得出与一帧主通道信号相对应的某帧副通道信号的功率
Py,式中:LEN表示一帧主通道信号所包含的采样点数、in_y(n)表示与一帧主通道信号相对应的某帧副通道信号在第n个采样点的采样值。
9.一种声音掩蔽方法,其特征在于所述声音掩蔽方法通过主通道接收语音信号,并通过副通道接收背景信号,所述声音掩蔽方法包括如下步骤:
步骤1:将所述主通道上的信号进行分帧处理得到各帧主通道信号,以及将所述副通道上的信号进行分帧处理得到各帧副通道信号,执行步骤2;
步骤2:将所述各帧主通道信号进行带通滤波,执行步骤3;
步骤3:对带通滤波后的各帧主通道信号为语音帧或噪声帧进行判断,执行步骤4;
步骤4:对各帧主通道信号进行时变带通滤波处理,同时对各帧副通道信号进行掩蔽处理;当一帧主通道信号为语音帧时,滤波带宽逐渐增大,同时与该语音帧相对应的某帧副通道信号逐渐减小,当一帧主通道信号为噪声帧时,滤波带宽逐渐减小,同时与该噪声帧相对应的某帧副通道信号逐渐增大,执行步骤5;
步骤5:将经过时变带通滤波处理后的一帧主通道信号同经过掩蔽处理的与该帧主通道信号相对应的一帧副通道信号对应叠加得到一帧输出信号。
10.根据权利要求9所述的声音掩蔽方法,其特征在于所述步骤3具体包括如下步骤:
步骤31:计算出经过带通滤波后的各帧主通道信号的功率,执行步骤32;
步骤32:根据计算出的经过带通滤波后的各帧主通道信号的功率,来获得语音功率集合、噪声功率集合、以及语音和噪声的功率分界阈值,执行步骤33;
步骤33:对噪声功率集合的各噪声功率在所述各帧主通道信号功率中的概率分布进行求和,并当得到的和值大于第一预设值时将所述各噪声功率中的最大值定义为Pn,执行步骤34;
步骤34:当Pn满足预设条件,以及所述语音功率集合中的各语音功率均值与所述噪声功率集合中各噪声功率均值之间满足预设关系时,更新Pn,否则保持Pn不变,执行步骤35;
步骤35:根据计算出的经过带通滤波后的一帧主通道信号的功率与Pn的大小比较结果,来确定该帧主通道信号为语音帧或噪声帧。

说明书全文

声音掩蔽器及声音掩蔽方法

技术领域

[0001] 本发明涉及一种声音掩蔽器及声音掩蔽方法。

背景技术

[0002] 在影视录音、比赛实况转播或电台直播时常常会有背景信号如音乐与对白(解说)同时出现的情况。此时,为了突出对白(解说)声音,则必须降低背景信号电平,使对白能够掩蔽背景信号;当对白(解说)结束时,背景信号则重新恢复到原来大小。声音掩蔽器就是实现上述功能的一种动态处理器,其主要是通过附加信号自动掩蔽主通道信号,一旦附加信号消失,主通道信号幅度自动复原。
[0003] 公开号为CN205004028U的中国实用新型专利提供了一种用于直接阻止他人听懂或有效录取谈话内容的单通道声音掩蔽器,其基本发明构思是:利用语言选择开关选择存储器中的语音干扰信号,并利用声音获取装置将语音转换成语音信号信号处理分为两个单元,第一信号处理单元将语音信号分割后随机组合,生成第一掩蔽信号;第二信号处理单元将语音干扰信号随机组合生成第二掩蔽信号;最后,音频播放器将第一掩蔽信号生成第一掩蔽声输出,将第二掩蔽信号生成第二掩蔽声输出。现有技术中的该种声音掩蔽方式存在如下问题:①生成的两路掩蔽信号不会随语音信号大小变化而自动改变大小,灵活性不高;②对输入语音信号未作任何处理,噪声可能对掩蔽结果有影响。

发明内容

[0004] 本发明针对以上问题的提出,而研制一种声音掩蔽器及声音掩蔽方法,该种声音掩蔽器及声音掩蔽方法能够避免在语音信号较弱,而噪声信号较强时,使用固定的判决电平会使得语音和噪声的判决结果不准确的技术问题,并且可以实现当主通道某一为语音帧时,其应该没有损失的全部通过,但当该帧为噪声帧时则尽可能将其滤除,从而将噪声的影响降到最低;同时该种声音掩蔽器及声音掩蔽方法能够实现在判断出主通道某一帧为语音帧时,相应帧内的副通道信号功率随语音功率快速减小但仍能被识别,当判断语音结束时,相应帧内的副通道信号功率缓慢增大,直到该帧结束。
[0005] 本发明的技术手段如下:
[0006] 一种声音掩蔽器,包括:
[0007] 接收语音信号的主通道;
[0008] 接收背景信号的副通道;
[0009] 分帧单元,用于将所述主通道上的信号进行分帧处理得到各帧主通道信号,以及将所述副通道上的信号进行分帧处理得到各帧副通道信号;
[0010] 与所述分帧单元相连接的带通滤波器;所述带通滤波器用于将所述各帧主通道信号进行带通滤波;
[0011] 与所述带通滤波器相连接的语音检测单元;所述语音检测单元用于对带通滤波后的各帧主通道信号为语音帧或噪声帧进行判断;
[0012] 与所述语音检测单元相连接的时变滤波器;所述时变滤波器用于对进行语音帧或噪声帧判断后的各帧主通道信号进行时变带通滤波处理;
[0013] 与所述分帧单元相连接的掩蔽单元;在所述时变滤波器对各帧主通道信号进行时变带通滤波处理的同时,所述掩蔽单元用于对各帧副通道信号进行掩蔽处理;当一帧主通道信号为语音帧时,所述时变滤波器的滤波带宽逐渐增大,同时所述掩蔽单元调整与该语音帧相对应的某帧副通道信号逐渐减小,当一帧主通道信号为噪声帧时,所述时变滤波器的滤波带宽逐渐减小,同时所述掩蔽单元调整与该噪声帧相对应的某帧副通道信号逐渐增大;
[0014] 与时变滤波器和掩蔽单元相连接的求和单元;所述求和单元用于将经过时变带通滤波处理后的一帧主通道信号同经过掩蔽处理的与该帧主通道信号相对应的某帧副通道信号对应叠加得到一帧输出信号
[0015] 进一步地,
[0016] 若进行带通滤波之前的一帧主通道信号在第n个采样点对应的采样值为in_x(n),则所述第n个采样点对应的采样值经过带通滤波器后的输出结果其中,IIR_A(k)为第k个滤波
系数、IIR_B(r)为第r个滤波系数、u(n-k)表示本帧主通道信号经带通滤波后第n-k个采样点对应的输出结果(当n≥k时)或上一帧主通道信号经带通滤波后倒数第k个采样点对应的输出结果(当n
[0017] 进一步地,所述语音检测单元包括:
[0018] 功率计算模,用于计算出经过带通滤波器后的各帧主通道信号的功率;
[0019] 与所述功率计算模块相连接的阈值获取模块;所述阈值获取模块用于根据功率计算模块计算出的经过带通滤波器后的各帧主通道信号的功率,来获得语音功率集合、噪声功率集合、以及语音和噪声的功率分界阈值;
[0020] 与阈值获取模块相连接的Pn获知模块;所述Pn获知模块用于对噪声功率集合的各噪声功率在所述各帧主通道信号的功率中的概率分布进行求和,并当得到的和值大于第一预设值时将所述各噪声功率中的最大值定义为Pn;当Pn满足预设条件,以及所述语音功率集合中的各语音功率均值与所述噪声功率集合中各噪声功率均值之间满足预设关系时,所述Pn获知模块更新Pn,否则保持Pn不变;
[0021] 与阈值获取模块和Pn获知模块相连接的判定模块;所述判定模块用于根据计算出的经过带通滤波器后的一帧主通道信号的功率与Pn的大小比较结果,来确定该帧主通道信号为语音帧或噪声帧;
[0022] 进一步地,所述功率计算模块通过公式Px=-10×log10(Preal/327682)来计算经过带通滤波后的一帧主通道信号的功率,式中:Px表示经过带通滤波后的该帧主通道信号的功率、 LEN表示主通道信号一帧长对应的采样点数、u(n)表示该帧主通道信号进行带通滤波后第n个采样点对应的采样值;
[0023] 进一步地,所述阈值获取模块获得语音功率集合、噪声功率集合、以及语音和噪声的功率分界阈值的具体过程为:
[0024] 对功率计算模块计算出的预设帧数的各帧主通道信号的功率值各自出现的频度进行统计;
[0025] 建立预设帧数的各帧主通道信号功率值的概率分布直方图,根据该概率分布直方图得到语音功率分布区域和噪声功率分布区域;
[0026] 采用最大类间方差法计算语音和噪声的功率分界阈值;
[0027] 进一步地,设定语音功率分布区域内的语音功率集合为[0,Pth-1]、噪声功率分布区域内的噪声功率集合为[Pth,Pm],其中,Pth-1表示语音功率分布区域内的语音功率最小值、Pth表示噪声功率分布区域内的噪声功率最大值、Pm表示噪声功率分布区域内的噪声功率最小值;所述阈值获取模块采用最大类间方差法计算语音和噪声的功率分界阈值Pthbest的具体过程为:
[0028] 通过公式 计算出语音功率集合中的各语音功率均值、通过公式计算出噪声功率集合中各噪声功率均值,其中, uv
表示语音功率集合中的各语音功率均值、un表示噪声功率集合中各噪声功率均值、pi表示语音功率i的分布概率、pk表示语音功率k的分布概率、i依次取值为[0,Pth-1]的各值、k依次取值为[Pth,Pm]的各值;
[0029] 利用公式uT=w0uv+w1un得出预设帧数的各帧主通道信号的平均功率,其中,uT表示预设帧数的各帧主通道信号的平均功率;
[0030] 通过公式σ2=w0(uv-uT)2+w1(un-uT)2获得语音功率与噪声功率之间的类间方差,并得出使类间方差σ2取值最大的功率值,该功率值为语音和噪声的功率分界阈值Pthbest;
[0031] 进一步地,所述判定模块首先设定状态值VAD的初值为0;针对某帧主通道信号,当状态值VAD为0,同时该帧主通道信号的功率值Px比Pn大第二预设值,则所述判定模块判定该帧主通道信号为语音帧,并将状态值VAD更新为1,当状态值VAD为1,同时该帧主通道信号的功率值Px比Pn小第三预设值,则所述判定模块判定该帧主通道信号为噪声帧,并将状态值VAD更新为0;
[0032] 进一步地,
[0033] 所述时变滤波器的中心频率为0.8kHz、幅频响应差分方程为
其中,r表
示带宽控制变量、变化范围为[0.005,0.995],具体地,当一帧主通道信号为语音帧时,带宽控制变量r由0.995按照步长step1变化至0.005,当一帧主通道信号为噪声帧时,带宽控制变量r由0.005按照步长step2变化至0.995,其中:fs表示采样频率、y(n)表示该帧主通道信号经时变带通滤波后第n个采样点对应的输出结果、y(n-1)表示上一帧主通道信号经时变带通滤波后倒数第1个采样点对应的输出结果、y(n-2)表示上一帧主通道信号经时变带通滤波后倒数第2个采样点对应的输出结果、j表示虚数单位,j2=-1、ω表示圆周频率;
[0034] 当一帧主通道信号为语音帧时,所述掩蔽单元调整与该语音帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐减小到该语音帧经过时变带通滤波后的功率的百分之一,当一帧主通道信号为噪声帧时,所述掩蔽单元调整与该噪声帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐增大到当前帧副通道信号的功率;所述掩蔽单元通过公式 得出与一帧主通道信号相对应的某帧副通道信号的功率Py,式中:LEN表示一帧主通道信号所包含的采样点数、in_y(n)表示与一帧主通道信号相对应的某帧副通道信号在第n个采样点的采样值。
[0035] 一种声音掩蔽方法,通过主通道接收语音信号,并通过副通道接收背景信号,所述声音掩蔽方法包括如下步骤:
[0036] 步骤1:将所述主通道上的信号进行分帧处理得到各帧主通道信号,以及将所述副通道上的信号进行分帧处理得到各帧副通道信号,执行步骤2;
[0037] 步骤2:将所述各帧主通道信号进行带通滤波,执行步骤3;
[0038] 步骤3:对带通滤波后的各帧主通道信号为语音帧或噪声帧进行判断,执行步骤4;
[0039] 步骤4:对各帧主通道信号进行时变带通滤波处理,同时对各帧副通道信号进行掩蔽处理;当一帧主通道信号为语音帧时,滤波带宽逐渐增大,同时与该语音帧相对应的某帧副通道信号逐渐减小,当一帧主通道信号为噪声帧时,滤波带宽逐渐减小,同时与该噪声帧相对应的某帧副通道信号逐渐增大,执行步骤5;
[0040] 步骤5:将经过时变带通滤波处理后的一帧主通道信号同经过掩蔽处理的与该帧主通道信号相对应的一帧副通道信号对应叠加得到一帧输出信号;
[0041] 进一步地,所述步骤3具体包括如下步骤:
[0042] 步骤31:计算出经过带通滤波后的各帧主通道信号的功率,执行步骤32;
[0043] 步骤32:根据计算出的经过带通滤波后的各帧主通道信号的功率,来获得语音功率集合、噪声功率集合、以及语音和噪声的功率分界阈值,执行步骤33;
[0044] 步骤33:对噪声功率集合的各噪声功率在所述各帧主通道信号功率中的概率分布进行求和,并当得到的和值大于第一预设值时将所述各噪声功率中的最大值定义为Pn,执行步骤34;
[0045] 步骤34:当Pn满足预设条件,以及所述语音功率集合中的各语音功率均值与所述噪声功率集合中各噪声功率均值之间满足预设关系时,更新Pn,否则保持Pn不变,执行步骤35;
[0046] 步骤35:根据计算出的经过带通滤波后的一帧主通道信号的功率与Pn的大小比较结果,来确定该帧主通道信号为语音帧或噪声帧。
[0047] 由于采用了上述技术方案,本发明提供的声音掩蔽器及声音掩蔽方法,能够避免在语音信号较弱,而噪声信号较强时,使用固定的判决电平会使得语音和噪声的判决结果不准确的技术问题,并且可以实现当主通道某一帧为语音帧时,其应该没有损失的全部通过,但当该帧为噪声帧时则尽可能将其滤除,从而将噪声的影响降到最低;同时该种声音掩蔽器及声音掩蔽方法能够实现在判断出主通道某一帧为语音帧时,相应帧内的副通道信号功率随语音功率快速减小但仍能被识别,当判断语音结束时,相应帧内的副通道信号功率缓慢增大,直到该帧结束;本发明掩蔽结果好,灵活性高。附图说明
[0048] 图1是本发明所述声音掩蔽器的结构框图
[0049] 图2是本发明所述语音检测单元的结构框图;
[0050] 图3是本发明预设帧数取值200时的各帧主通道信号的功率示意图;
[0051] 图4是作为本发明所述声音掩蔽器输入信号的语音信号;
[0052] 图5是作为本发明所述声音掩蔽器输入信号的背景信号;
[0053] 图6是本发明状态值VAD的变化曲线示意图;
[0054] 图7是本发明背景信号在语音信号有无的作用下,其增益变化的过程示意图;
[0055] 图8是经过本发明所述声音掩蔽器处理后的背景信号;
[0056] 图9是本发明所述声音掩蔽器的输出信号;
[0057] 图10是本发明预设帧数的各帧主通道信号的功率值的概率分布直方图;
[0058] 图11是本发明所述声音掩蔽方法的流程图

具体实施方式

[0059] 如图1和图2所示的一种声音掩蔽器,包括:接收语音信号的主通道;接收背景信号的副通道;分帧单元,用于将所述主通道上的信号进行分帧处理得到各帧主通道信号,以及将所述副通道上的信号进行分帧处理得到各帧副通道信号;与所述分帧单元相连接的带通滤波器;所述带通滤波器用于将所述各帧主通道信号进行带通滤波;与所述带通滤波器相连接的语音检测单元;所述语音检测单元用于对带通滤波后的各帧主通道信号为语音帧或噪声帧进行判断;与所述语音检测单元相连接的时变滤波器;所述时变滤波器用于对进行语音帧或噪声帧判断后的各帧主通道信号进行时变带通滤波处理;与所述分帧单元相连接的掩蔽单元;在所述时变滤波器对各帧主通道信号进行时变带通滤波处理的同时,所述掩蔽单元用于对各帧副通道信号进行掩蔽处理;当一帧主通道信号为语音帧时,所述时变滤波器的滤波带宽逐渐增大,同时所述掩蔽单元调整与该语音帧相对应的某帧副通道信号逐渐减小,当一帧主通道信号为噪声帧时,所述时变滤波器的滤波带宽逐渐减小,同时所述掩蔽单元调整与该噪声帧相对应的某帧副通道信号逐渐增大;与时变滤波器和掩蔽单元相连接的求和单元;所述求和单元用于将经过时变带通滤波处理后的一帧主通道信号同经过掩蔽处理的与该帧主通道信号相对应的某帧副通道信号对应叠加得到一帧输出信号;进一步地,若进行带通滤波之前的一帧主通道信号在第n个采样点对应的采样值为in_x(n),则所述第n个采样点对应的采样值经过带通滤波器后的输出结果其中,IIR_A(k)为第k个滤波
系数、IIR_B(r)为第r个滤波系数、u(n-k)表示本帧主通道信号经带通滤波后第n-k个采样点对应的输出结果(当n≥k时)或上一帧主通道信号经带通滤波后倒数第k个采样点对应的输出结果(当n道信号进行带通滤波后第n个采样点对应的采样值;进一步地,所述阈值获取模块获得语音功率集合、噪声功率集合、以及语音和噪声的功率分界阈值的具体过程为:对功率计算模块计算出的预设帧数的各帧主通道信号的功率值各自出现的频度进行统计;建立预设帧数的各帧主通道信号功率值的概率分布直方图,根据该概率分布直方图得到语音功率分布区域和噪声功率分布区域;采用最大类间方差法计算语音和噪声的功率分界阈值;进一步地,设定语音功率分布区域内的语音功率集合为[0,Pth-1]、噪声功率分布区域内的噪声功率集合为[Pth,Pm],其中,Pth-1表示语音功率分布区域内的语音功率最小值、Pth表示噪声功率分布区域内的噪声功率最大值、Pm表示噪声功率分布区域内的噪声功率最小值;所述阈值获取模块采用最大类间方差法计算语音和噪声的功率分界阈值Pthbest的具体过程为:通过公式计算出语音功率集合中的各语音功率均值、通过公式 计算出
噪声功率集合中各噪声功率均值,其中, uv表示语音功率集合中
的各语音功率均值、un表示噪声功率集合中各噪声功率均值、pi表示语音功率i的分布概率、pk表示语音功率k的分布概率、i依次取值为[0,Pth-1]的各值、k依次取值为[Pth,Pm]的各值;
利用公式uT=w0uv+w1un得出预设帧数的各帧主通道信号的平均功率,其中,uT表示预设帧数的各帧主通道信号的平均功率;通过公式σ2=w0(uv-uT)2+w1(un-uT)2获得语音功率与噪声功率之间的类间方差,并得出使类间方差σ2取值最大的功率值,该功率值为语音和噪声的功率分界阈值Pthbest;进一步地,所述判定模块首先设定状态值VAD的初值为0;针对某帧主通道信号,当状态值VAD为0,同时该帧主通道信号的功率值Px比Pn大第二预设值,则所述判定模块判定该帧主通道信号为语音帧,并将状态值VAD更新为1,当状态值VAD为1,同时该帧主通道信号的功率值Px比Pn小第三预设值,则所述判定模块判定该帧主通道信号为噪声帧,并将状态值VAD更新为0;进一步地,所述时变滤波器的中心频率为0.8kHz、幅频响应差分方程为
其中,r表
示带宽控制变量、变化范围为[0.005,0.995],具体地,当一帧主通道信号为语音帧时,带宽控制变量r由0.995按照步长step1变化至0.005,当一帧主通道信号为噪声帧时,带宽控制变量r由0.005按照步长step2变化至0.995,其中:fs表示采样频率、y(n)表示该帧主通道信号经时变带通滤波后第n个采样点对应的输出结果、y(n-1)表示上一帧主通道信号经时变带通滤波后倒数第1个采样点对应的输出结果、y(n-2)表示上一帧主通道信号经时变带通滤波后倒数第2个采样点对应的输出结果、j表示虚数单位,j2=-1、ω表示圆周角频率;当一帧主通道信号为语音帧时,所述掩蔽单元调整与该语音帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐减小到该语音帧经过时变带通滤波后的功率的百分之一,当一帧主通道信号为噪声帧时,所述掩蔽单元调整与该噪声帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐增大到当前帧副通道信号的功率;所述掩蔽单元通过公式得出与一帧主通道信号相对应的某帧副通道信号的功率Py,式中:
LEN表示一帧主通道信号所包含的采样点数、in_y(n)表示与一帧主通道信号相对应的某帧副通道信号在第n个采样点的采样值。
[0060] 如图11所示的一种声音掩蔽方法,通过主通道接收语音信号,并通过副通道接收背景信号,所述声音掩蔽方法包括如下步骤:
[0061] 步骤1:将所述主通道上的信号进行分帧处理得到各帧主通道信号,以及将所述副通道上的信号进行分帧处理得到各帧副通道信号,执行步骤2;
[0062] 步骤2:将所述各帧主通道信号进行带通滤波,执行步骤3;
[0063] 步骤3:对带通滤波后的各帧主通道信号为语音帧或噪声帧进行判断,执行步骤4;
[0064] 步骤4:对各帧主通道信号进行时变带通滤波处理,同时对各帧副通道信号进行掩蔽处理;当一帧主通道信号为语音帧时,滤波带宽逐渐增大,同时与该语音帧相对应的某帧副通道信号逐渐减小,当一帧主通道信号为噪声帧时,滤波带宽逐渐减小,同时与该噪声帧相对应的某帧副通道信号逐渐增大,执行步骤5;
[0065] 步骤5:将经过时变带通滤波处理后的一帧主通道信号同经过掩蔽处理的与该帧主通道信号相对应的一帧副通道信号对应叠加得到一帧输出信号;
[0066] 进一步地,所述步骤3具体包括如下步骤:
[0067] 步骤31:计算出经过带通滤波后的各帧主通道信号的功率,执行步骤32;
[0068] 步骤32:根据计算出的经过带通滤波后的各帧主通道信号的功率,来获得语音功率集合、噪声功率集合、以及语音和噪声的功率分界阈值,执行步骤33;
[0069] 步骤33:对噪声功率集合的各噪声功率在所述各帧主通道信号功率中的概率分布进行求和,并当得到的和值大于第一预设值时将所述各噪声功率中的最大值定义为Pn,执行步骤34;
[0070] 步骤34:当Pn满足预设条件,以及所述语音功率集合中的各语音功率均值与所述噪声功率集合中各噪声功率均值之间满足预设关系时,更新Pn,否则保持Pn不变,执行步骤35;
[0071] 步骤35:根据计算出的经过带通滤波后的一帧主通道信号的功率与Pn的大小比较结果,来确定该帧主通道信号为语音帧或噪声帧。
[0072] 进一步地,若进行带通滤波之前的一帧主通道信号在第n个采样点对应的采样值为in_x(n),则所述第n个采样点对应的采样值经过带通滤波后的输出结果其中,IIR_A(k)为第k个滤波
系数、IIR_B(r)为第r个滤波系数、u(n-k)表示本帧主通道信号经带通滤波后第n-k个采样点对应的输出结果(当n≥k时)或上一帧主通道信号经带通滤波后倒数第k个采样点对应的输出结果(当n
[0073] 进一步地,所述步骤31具体为:通过公式Px=-10×log10(Preal/327682)来计算经过带通滤波后的一帧主通道信号的功率,式中:Px表示经过带通滤波后的该帧主通道信号的功率、 LEN表示主通道信号一帧长对应的采样点数、u(n)表示该帧主通道信号进行带通滤波后第n个采样点对应的采样值;
[0074] 进一步地,所述步骤32具体包括如下步骤:
[0075] 步骤321:对预设帧数的各帧主通道信号的功率值各自出现的频度进行统计;
[0076] 步骤322:建立预设帧数的各帧主通道信号功率值的概率分布直方图,根据该概率分布直方图得到语音功率分布区域和噪声功率分布区域;
[0077] 步骤323:采用最大类间方差法计算语音和噪声的功率分界阈值Pthbest;
[0078] 进一步地,设定语音功率分布区域内的语音功率集合为[0,Pth-1]、噪声功率分布区域内的噪声功率集合为[Pth,Pm],其中,Pth-1表示语音功率分布区域内的语音功率最小值、Pth表示噪声功率分布区域内的噪声功率最大值、Pm表示噪声功率分布区域内的噪声功率最小值;采用最大类间方差法计算语音和噪声的功率分界阈值Pthbest的具体过程为:
[0079] 通过公式 计算出语音功率集合中的各语音功率均值、通过公式计算出噪声功率集合中各噪声功率均值,其中, uv
表示语音功率集合中的各语音功率均值、un表示噪声功率集合中各噪声功率均值、pi表示语音功率i的分布概率、pk表示语音功率k的分布概率、i依次取值为[0,Pth-1]的各值、k依次取值为[Pth,Pm]的各值;
[0080] 利用公式uT=w0uv+w1un得出预设帧数的各帧主通道信号的平均功率,其中,uT表示预设帧数的各帧主通道信号的平均功率;
[0081] 通过公式σ2=w0(uv-uT)2+w1(un-uT)2获得语音功率与噪声功率之间的类间方差,并得出使类间方差σ2取值最大的功率值,该功率值为语音和噪声的功率分界阈值Pthbest;
[0082] 进一步地,所述步骤35具体为:首先设定状态值VAD的初值为0;针对某帧主通道信号,当状态值VAD为0,同时该帧主通道信号的功率值Px比Pn大第二预设值,则判定该帧主通道信号为语音帧,并将状态值VAD更新为1,当状态值VAD为1,同时该帧主通道信号的功率值Px比Pn小第三预设值,则判定该帧主通道信号为噪声帧,并将状态值VAD更新为0;
[0083] 进一步地,采用时变滤波器对各帧主通道信号进行时变带通滤波处理;所述时变滤波器的中心频率为0.8kHz、幅频响应 差分方程为 其中,
r表示带宽控制变量、变化范围为[0.005,0.995],具体地,当一帧主通道信号为语音帧时,带宽控制变量r由0.995按照步长step1变化至0.005,当一帧主通道信号为噪声帧时,带宽控制变量r由0.005按照步长step2变化至0.995,其中:fs表示采样频率、y(n)表示该帧主通道信号经时变带通滤波后第n个采样点对应的输出结果、y(n-1)表示上一帧主通道信号经时变带通滤波后倒数第1个采样点对应的输出结果、y(n-2)表示上一帧主通道信号经时变带通滤波后倒数第2个采样点对应的输出结果、j表示虚数单位,j2=-1、ω表示圆周角频率;
[0084] 当一帧主通道信号为语音帧时,调整与该语音帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐减小到该语音帧经过时变带通滤波后的功率的百分之一,当一帧主通道信号为噪声帧时,调整与该噪声帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐增大到当前帧副通道信号的功率;通过公式 得出与一帧主通道信号相对应的某帧副通道信号的功率Py,式中:LEN表示一帧主通道信号所包含的采样点数、in_y(n)表示与一帧主通道信号相对应的某帧副通道信号在第n个采样点的采样值。
[0085] 本发明对预设帧数的各帧主通道信号的功率值各自出现的频度进行统计的具体过程为:首先对预设帧数的各帧主通道信号的功率值分别进行取整操作,然后从第一帧主通道信号的功率值开始依次将各帧主通道信号的功率值作为累加器下标,直至将预设帧数的各帧主通道信号的功率值全部遍历,若预设帧数的各帧主通道信号的功率值中存在某几个值相等,则对应该值下标的累加器加一,进而得出第i帧主通道信号的功率值出现的概率所述预设帧数可以取值200。
[0086] 本发明将各帧主通道信号进行带通滤波,可以减小噪声对语音检测结果的影响;带通滤波器的带宽为0.3kHz~3.4kHz;所述带通滤波器的参考设计指标为:中心频率为
1.55kHz、通带频率范围为0.3kHz~3.4kHz、下阻带截止频率为1Hz、上阻带截止频率为
4kHz、阻带衰减大于60dB;该带通滤波器的参考设计结果为一个7阶IIR滤波器,其滤波系数IIR_B(7)={1.012205768830948×10-3,-4.911110647449132×10-4,7.807184279553245×10-5,-1.198332967805191×10-3,7.807184279553245×10-5,-4.911110647449132e×
10-4,1.012205768830948×10-3};滤波系数IIR_A(7)={1.0,-5.380875974547,
12.23643655587558,-15.06088779864848,10.58294743567488,-4.024466821830663,
0.6468480167658538};当n
[0087] 本发明所述第一预设值为0.1;所述第二预设值为12dB;所述第三预设值为6dB;所述预设条件是指Pn处于[Pthbest,Pm]范围,所述预设关系是指|uv-un|>10;LEN可以取值960;2
本发明通过公式Px=-10×log10(Preal/32768)来计算经过带通滤波后的一帧主通道信号的功率,其中, 为一个中间变量,具体地,Preal表示经过带通滤波后的一帧主通道信号的实际功率,相应地,Px是表示经过带通滤波后的一帧主通道信号的相对功率值,
2
本发明定义0dBoV处对应的实际功率值为32768 ,故Px为相对0dBoV的一个相对功率值;本发明还可以采用包络检波或峰值检波求出主通道信号和副通道信号的包络,再利用每帧包络求出功率。
[0088] 图3示出了本发明预设帧数取值200时的各帧主通道信号的功率示意图,如图3所示,Px与之前求得的199帧语音信号的功率共同组成预设帧数即200帧主通道信号的功率。
[0089] 图10示出了本发明预设帧数的各帧主通道信号功率值的概率分布直方图,如图10所示,预设帧数的各帧主通道信号的功率值的概率分布直方图建立之后,可以根据该概率分布直方图得到语音功率分布区域和噪声功率分布区域,并获得所述语音功率分布区域和噪声功率分布区域之间的分界区域,语音和噪声的功率分界阈值Pthbest便在该分界区域中通过最大类间方差法进行计算获得。
[0090] 本发明当一帧主通道信号为语音帧时,所述时变滤波器的滤波带宽逐渐增大,同时所述掩蔽单元调整与该语音帧相对应的某帧副通道信号逐渐减小,具体地,通过控制某帧副通道信号的功率实现该帧副通道信号的幅值减小,当一帧主通道信号为噪声帧时,所述时变滤波器的滤波带宽逐渐减小,同时所述掩蔽单元调整与该噪声帧相对应的某帧副通道信号逐渐增大,具体地,通过控制某帧副通道信号的功率实现该帧副通道信号的幅值增大;本发明y(n-1)、y(n-2)初始化赋初值均为0;当一帧主通道信号为语音帧时,与该语音帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐减小到该语音帧经过时变带通滤波后的功率的百分之一,当一帧主通道信号为噪声帧时,与该噪声帧相对应的某帧副通道信号功率由上一帧副通道信号功率逐渐增大到当前帧副通道信号的功率,具体地,当状态值VAD为1时,副通道信号增益curr_gain在一帧内按照每点步长0.01快速减小,直至达到最小值 Pxx表示经过时变带通滤波后的一帧主通道信号的功率,当状态值VAD为0时,副通道信号增益curr_gain在一帧内按照每点步长0.000005缓慢增大,直至达到预设最大增益1;实际应用时帧长可以为20ms,采样频率为48kHz,进而一帧长所对应的采样点数为960,这里的每点步长则指960个采样点的步长;副通道信号在一帧内第n个采样点的输出outputm(n)=curr_gain*in_y(n);本发明最后将经过时变带通滤波处理后的一帧主通道信号同经过掩蔽处理的与该帧主通道信号相对应的某帧副通道信号对应叠加得到一帧输出信号,具体地,在第n个采样点处,输出信号为output(n)=y(n)+curr_gain*in_y(n)。
[0091] 本发明带宽控制变量r的变化范围为[0.005,0.995],具体地,当状态值VAD为1时,带宽控制变量r由0.995按照步长step1变化至0.005,当状态值VAD为0时,带宽控制变量r由0.005按照步长step2变化至0.995,其中: fs
表示采样频率、y(n)表示该帧主通道信号经时变带通滤波后第n个采样点对应的输出结果、y(n-1)表示上一帧主通道信号经时变带通滤波后倒数第1个采样点对应的输出结果、y(n-
2)表示上一帧主通道信号经时变带通滤波后倒数第2个采样点对应的输出结果(当y(n)为第1个采样点时,y(n-1)和y(n-2)需赋初值为0)、j表示虚数单位,j2=-1、w表示圆周角频率,具体地,当fs取值48kHz时,step1=0.0006875,step2=0.000006875,由于步长step1比步长step2大很多,因此,当r按步长step1变化时,会短时间内快速变化到0.005,当r按step2变化时,则需较长时间缓慢变化到0.995。
[0092] 下面以所述副通道信号为背景音乐信号来测试本发明实施后的具体效果,图4示出了本发明所述声音掩蔽器主通道上的接收信号(语音信号),图5示出了作为本发明所述声音掩蔽器副通道上的接收信号(背景音乐信号);测试声音掩蔽器的过程中,使用最大类间方差法(Ostu)来求语音和噪声的功率分界阈值,并结合Pn判断一帧主通道信号为语音帧(状态值VAD为1)还是噪声帧(状态值VAD为0),图6示出了状态值VAD的变化曲线示意图,如图6所示,可以看到在有语音处,状态值VAD为1,当语音消失时,状态值VAD等于0;图7示出了本发明背景音乐信号在语音信号有无的作用下,其增益变化的过程,如图7所示,可以看出当语音信号存在时,背景音乐信号增益快速减小,当语音信号结束后,背景音乐信号增益则缓慢增大;图8示出了经过本发明所述声音掩蔽器处理后的背景音乐信号,图9示出了本发明所述声音掩蔽器的输出信号;测试结果表明,当语音信号存在时,既可以突出语音信号也可以辨识出背景音乐;当没有语音信号时,背景音乐较平滑地逐渐增大,人听觉体验效果良好。
[0093] 本发明能够避免在语音信号较弱,而噪声信号较强时,使用固定的判决电平会使得语音和噪声的判决结果不准确的技术问题,并且可以实现当主通道某一帧为语音信号时,其应该没有损失的全部通过,但当该帧为噪声时则尽可能将其滤除,从而将噪声的影响降到最低;同时该种声音掩蔽器及声音掩蔽方法能够实现在判断出主通道某一帧为语音信号时,相应帧内的副通道信号功率随语音功率快速减小但仍能被识别,当判断语音结束时,相应帧内的副通道信号功率缓慢增大,直到该帧结束;进一步地,本发明使用Ostu算法来获得语音和噪声的功率分界阈值,提高了功率分界阈值的准确性;对语音帧和噪声帧使用时变滤波器进行时变带通滤波处理,既保证了语音能量尽可能多的通过,也降低了噪声对信号的影响;同时副通道信号在进行掩蔽处理时是按帧跟随主通道信号大小变换。
[0094] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈