[0036] 式中,λΝ为噪声遗忘因子;ΧΚη,ΐΟ表示主麦克风接收信号的时频域值;
[0037]主麦克风与次麦克风带噪音的互功率谱密度CPSD为:
[0038] Ρλ ,,.(»,λ) = Hl2(nJ)Ps (//,k) + P, χ (//,k):
[0039] 其中幻为两个麦克风接收噪声信号的CPSD,通过下式进行估计:
[0040] PN^ (n,k) = {η -1,+ (1 -iv) | Χ,{η,k)X2(n,k) \ if η < T[0041 ]及(》,幻通过主麦克风接收信号PSD与估计噪声PSD的差值进行估计:
[0042] h («, k) = P^( /7, k) - A, {ti,k)
[0043] 从而得到估计的冲击响应函数H12(n,k):
[0045] 两个麦克风接收信号的PSD和CPSD,即\ (/α)和巧1:1.2 ,采用如下的递归平均 方法来估计:
[0046] Ρχ (ηΛ)=Αλ Px ()!- 1,/ί) + (1 - /lA) | .¥,.(//,/:) ί:, (/ = 1.2);
[0047] Ργ ν (n,k')=Ax f\ Χ^(η-],!<) +(1~^yXyini^X.{π,k);
[0048] 其中λχ为带噪语音遗忘因子。将主麦克风以及次麦克风做短时傅里叶变换后的语 音信号与维纳滤波器相乘,并做离散傅里叶逆变换处理及叠接相加,从而得到降噪之后的 时域语音信号。
[0049] 3、根据权利要求1所述的方法,其特征在于,所述采用基于双麦克风之间相干性的 语音降噪方法来获取降噪后的语音信号包括:
[0050] 主麦克风与次麦克风接收到的语音信号如下:
[0051] xi(m) = si(m)+m(m),i = 1,2
[0052] 其中,m为采样点,X1(m)为主麦克风接收到的语音信号,x2(m)为次麦克风接收到的 语音信号,m(m)为噪声, Sl(m)为目标语音;
[0053]进行短时傅里叶变换后得到:
[0054] Xi(n,k) = Si(n,k)+Ni(n,k), i = 1,2;
[0055] 其中,n和k分别表示时间点和频率点;
[0056] 定义主麦克风与次麦克风接收到的语音信号的相干性函数为:
[0058] 式中,幻分别为主麦克风与次麦克风带噪音的功率谱密度PSD, 八为主麦克风与次麦克风带噪语音的互功率谱密度;
[0059] 相干性函数与主麦克风与次麦克风局部
信噪比SNRjPSNR2有如下关系:
[0061] 其中,和分别表示两个麦克风接收的目标语音相干性函数和噪声相干性 函数;
[0062] r^^rv/; + rv!;(i-G);
[0063] 当使用扬声器通话模式时,假设目标语音信号源在双麦克的正前方,选取两麦克 风
位置的中心作为阵列参考点,则目标语音方向即为〇°,背景噪声信号源等效为从Θ方向入 射,贝主麦克风与次麦克风接收到的信号Ul和U2之间的相干性为:
[0064] =
[0065] 式中,fs是采样率,d是主麦克风与次麦克风的间距,c为声速;山和1]2表示主麦克风 与次麦克风接收到的语音信号或者噪声信号;
[0066]将上面两个表达式相结合,得到:
[0068] 其中,τ = fs (d/c),分别取出
实部和
虚部:
[0069] R = G + (\ -G')cosa ;
[0070] / = (1-G)sin«;[0071 ] 其中,α= ω TSin0,分别对实部和虚部表达式变型,得到:
[0074]由于上述两式相等,则有:
[0075] Icosa = (R-l )sina+I ;
[0076] 根据 cos2a+sin2a = 1,得到:
[0077] (I2+(l-R)2)sin2a+2I(R-l)sina = 〇;
[0078] 其根为:
[0086] 将主麦克风以及次麦克风做短时傅里叶变换后的语音信号与维纳滤波器相乘,并 做离散傅里叶逆变换处理及叠接相加,从而得到降噪之后的时域语音信号。
[0087] 由上述本发明提供的技术方案可以看出,可以根据用户所使用模式的不同来选取 对应的降噪方法;在正常手持通话模式下,基于功率水平差异的方法适用于该模式下的近 场信号模型,且能有效利用主次麦克风接收语音信号在
能量上的较大差异信息;在使用扬 声器模式下,利用基于双麦克风之间相关性的方法不需要进行噪声功率谱的估计,且能够 避免两个麦克风接收噪声不一致对于基于功率水平差异方法的影响;此外,相比于传统的 基于功率水平差异的方法,本发明通过构造的维纳滤波能有效避免噪声功率谱估计错误导 致的音乐噪声。
附图说明
[0088] 为了更清楚地说明本发明
实施例的技术方案,下面将对实施例描述中所需要使用 的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本 领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 附图。
[0089] 图1为本发明实施例提供的一种应用于双麦克风小型手持设备的语音降噪方法的
流程图;
[0090] 图2为本发明实施例提供的基于双麦克风功率水平差异的语音降噪方法的流程 图;[0091 ]图3为本发明实施例提供的基于双麦克风之间相干性的语音降噪方法的流程图;
[0092] 图4为本发明实施例提供的基于双麦克风之间相干性的语音降噪技术信号模型。
具体实施方式
[0093] 下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整 地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本 发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例,都属于本发明的保护范围。
[0094] 如图1所示,为本发明实施例提供的一种应用于双麦克风小型手持设备的语音降 噪方法的流程图,其主要包括如下步骤:
[0095] 步骤11、接收双麦克风的语音信号,并进行通话模式的判别;
[0096] 步骤12、若当前为手持通话模式,则采用基于双麦克风功率水平差异的语音降噪 方法来获取降噪后的语音信号;
[0097] 步骤13、若当前为扬声器通话模式,则采用基于双麦克风之间相干性的语音降噪 方法来获取降噪后的语音信号。
[0098] 本发明实施例中,根据用户所使用模式的不同来选取对应的降噪方法。在正常手 持通话模式下,基于功率水平差异的方法适用于该模式下的近场信号模型,且能有效利用 主次麦克风接收语音信号在能量上的较大差异信息;在使用扬声器模式下,利用基于双麦 克风之间相关性的方法不需要进行噪声功率谱的估计,且能够避免两个麦克风接收噪声不 一致对于基于功率水平差异方法的影响。
[0099] 下面主要针对基于双麦克风功率水平差异的语音降噪方法以及基于双麦克风之 间相干性的语音降噪方法进行详细的介绍。
[0100] 1、基于双麦克风功率水平差异的语音降噪方法。
[0101] 在正常的手持通话模式下,我们默认的是双麦克风与说话人嘴巴构成一个近场环 境。在该环境下的声波模型为球形波,传统的基于相位的降噪技术并不适用这一模型。而利 用功率水平差异(Power Level Difference,PLD),则避免了这一问题。[0102 ]其具体的处理流程如图2所示,主要为:
[0103] 主麦克风与次麦克风接收到的语音信号如下:
[0104] XI(m) =hi(m)*s(m)+ni(m);
[0105] X2(m) =h2(m)*s(m)+n2(m);
[0106] 其中,m为采样点,X1(m)为主麦克风接收到的语音信号,X2(m)为次麦克风接收到的 语音信号;hi(m)为声波传播模型冲击响应,m(m)为噪声,i = l,2;s(m)为目标语音,*为卷积 操作;
[0107] 对主麦克风与次麦克风接受到的语音信号分别做短时傅里叶变换将其转换到时 频域,得到:
[0108] Xi(n,k)=Hi(n,k)S(n,k)+Ni(n,k);
[0109] X2(n,k)=H2(n,k)S(n,k)+N2(n,k);
[0110] 其中,η和k分别表示时间点和频率点;不失一般性,将上述两个式子改写为:
[0111] Xi(n,k) = Si(n,k)+Ni(n,k);
[0112] X2(n,k)=Hi2(n,k)Si(n,k)+N2(n,k);
[0113] 其中,SKhk)表示HKhlOSU^),4艮据短时傅里叶变 换结果分别计算主麦克风与次麦克风带噪音的功率谱密度(PSD),得到:
[0114] Λ. {n,k) = Ps (/7,/:) i\ (n,k);
[0115] Ρχ {ηΛ) =j I/i2(n,k) |: Ps (n.k) + ;
[0116] 其中,&表示主麦克风接收到的语音信号的PSD,仏幻表示主麦克风接收 到的噪声信号的PSD,fv:(»A)表示次麦克风接收到的噪声信号的PSD。
[0117] 将 ' (",々: (/7,幻相减得到:
[0118] ΡΧί(ηΛ)- PxJn,k) = (.1- \ Η]2(ηΛ) \2)PSi(jhk) + P^{nfk) ~ ;
[0119]令碼(",幻-Ρ'.(仏々),Δ/\ =Ρ、.(",Α·)-Ρ、」(/α);另外,一般假设两个麦克 风接收到的背景噪声可以认为差异不大,故A ΡΝ可以忽略不计,即Δ ΡΝ~〇,则有:
[0120] | APx(n,k) Η (1-1 Hl2(n,k) |2)| PA. (n,k) a
[0121] 利用估计的语音信号PSD和噪声信号PSD可以构造维纳滤波器G^(n,k),这里我们 利用估计的主麦克风语音信号PSD & 幻和噪声信号PSD^ («,幻进行构造:
[0123] 其中,GAP(n,k)的下标ΔΡ表示该滤波器是基于功率水平差得到的。&(»,幻不能直 接估计得到,故可将I ΔΡχ(η,1〇 I表达式带入上式,得到:
[0125]为了不使语音产生太大失真,在上式中加入一个自由参数α,则有G^(n,k)的估计 式:
[0127] 其中,主麦克风噪声的PSD采用语音信号开始的T纯噪声帧计算,公式如下:
[0128] R (/?, k) = ^NPN:] in -1,.^.) + (1 - Λ#) | Χχ(n, k) f if η < T
[0129] 式中,λΝ为噪声遗忘因子,由经验值设定;ΧΚη,ΐΟ表示主麦克风接收信号的时频域 值;
[0130]则现在G^P(n,k)估计式中仅有冲击响应函数H12(n,k)为未知的;考虑互功率谱密 度(CPSD),主麦克风与次麦克风接收信号的CPSD为:[0131 ] Px x'('!hk、= Η':、η,Ιί)Ρ、i/Kk、+ \
[0132] 其中,幻为两个麦克风接收噪声信号的CPSD,类似于&(»,幻的计算,可以 通过下式进行估计:
[0133] PN| N: (/7,k) - /:Λ f\ x (n-lk) + (1 -/ίΝ) | X,(/7,k)X7(n,k) \ if n
[0134] 可以通过主麦克风接收信号PSD与估计噪声PSD的差值进行估计:
[0135] PS[ (n,k) ^ PXi (n,k) -^ (n,k). t
[0136] 从而得到估计的冲击响应函数//l2(o,幻:
[0138]本发明实施例中,两个麦克风接收信号的PSD和CPSD(即Λ (",幻和&;^0,幻)我们 采用如下的递归平均方法来估计:
[0141] 其中λχ为带噪语音遗忘因子。此时G^(n,k)表达式中的参数均求出,则获得了用于 增强语音的维纳滤波器,将主麦克风以及次麦克风做短时傅里叶变换后的语音信号与维纳 滤波器相乘,并做离散傅里叶逆变换处理(IFFT)及叠接相加,从而得到降噪之后的时域语 首ί目号(5'〗、幻:)。:
[0142] 2、基于双麦克风之间相干性的语音降噪方法。
[0143] 在使用扬声器通话的模式下,可以认为两个麦克风与说话人嘴巴构成一个远场环 境。此时,本发明采用基于双麦克风接收信号相干性的语音降噪技术。这个方法不需要进行 噪声功率谱的估计,且能够避免两个麦克风接收噪声不一致对于基于功率水平差异方法的 影响。
[0144] 在双麦克风条件下,两个麦克风接收到的语音信号之间是有相干性的。这个相干 性可以用来估计带噪语音信号的每个时频点的SNR,从而利用维纳滤波的思想就能达到语 音降噪的目的。
[0145] 其具体的处理流程如图3所示,主要为:
[0146] 主麦克风与次麦克风接收到的语音信号如下:
[0147] xi(m) = si(m)+m(m),i = 1,2
[0148] 其中,m为采样点,X1(m)为主麦克风接收到的语音信号,X2(m)为次麦克风接收到的 语音信号,m(m)为噪声, Sl(m)为目标语音;
[0149] 进行短时傅里叶变换后得到:
[0150] Xi(n,k) = Si(n,k)+Ni(n,k), i = 1,2;[0151 ]其中,η和k分别表示时间点和频率点;
[0152]定义主麦克风与次麦克风接收到的语音信号的相干性函数为:
[0154] 式中幻与仏(",幻分别为主麦克风与次麦克风带噪音的功率谱密度PSD, 巧^2(»,幻为主麦克风与次麦克风带噪语音的互功率谱密度;同样可以采用前文所述的递归 平均方法求得。
[0155] 相干性函数与主麦克风与次麦克风局部信噪比SNRjPSNR2有如下关系:
[0157]其中,1^2和1^2分别表示两个麦克风接收的目标语音相干性函数和噪声相干性 函数。如果两个麦克风非常接近(例如2cm),则SNRi^SNfc成立,但是如果两个麦克风相隔比 较远(例如15cm),则上述假设不一定成立。但是可以认为在两个麦克风处,-(或
)是相等的。
[0160]如图4所示,当使用扬声器通话模式时,假设目标语音信号源在双麦克的正前方, 选取两麦克风位置的中心作为阵列参考点,则目标语音方向即为〇°,背景噪声信号源等效 为从Θ方向入射。根据阵列
信号处理理论,对于两个同源信号山和1] 2(同一个目标语音或噪声 分别被两个麦克风接收的信号),主麦克风与次麦克风接收到的信号之间的相干性可以表 示为:
[0162] 式中,fs是采样率,d是主麦克风与次麦克风的间距,c为声速;
[0163] 将上面两个表达式相结合,得到:
[0168] 其中,α= ω TSin0,分别对实部和虚部表达式变型,得到:
[0171] 由于上述两式相等,则有:
[0172] Icosa = (R-l )sina+I ;
[0173] 根据 cos2a+sin2a = 1,得到:
[0174] (I2+(l-R)2)sin2a+2I(R-l)sina = 〇;
[0175] 其根为:
[0181] 从而构建非限制维纳滤波器G™h(n,k)(下标coh表示该滤波器是基于相干性得到 的):
[0183] 将主麦克风以及次麦克风做短时傅里叶变换后的语音信号与维纳滤波器相乘,并 做离散傅里叶逆变换处理及叠接相加,从而得到降噪之后的时域目标语音信号(U 2 >。:
[0184] 本发明实施例上述方案,相比于传统的手持设备双麦克风语音降噪技术,可以根 据用户所使用模式的不同来选取对应的降噪方法。在正常手持通话模式下,利用基于功率 水平差异的方法能避免近场效应的影响;在使用扬声器模式下,利用基于双麦克风之间相 关性的方法不需要进行噪声功率谱的估计,且能够避免两个麦克风接收噪声不一致对于基 于功率水平差异方法的影响。此外,相比于传统的基于功率水平差异的方法,通过构造的维 纳滤波能有效避免噪声功率谱估计错误导致的音乐噪声。
[0185] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可 以通过
软件实现,也可以借助软件加必要的通用
硬件平台的方式来实现。基于这样的理解, 上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易 失性存储介质(可以是CD-R0M,U盘,移动
硬盘等)中,包括若干指令用以使得一台计算机设 备(可以是个人计算机,
服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0186] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此, 任何熟悉
本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换, 都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范 围为准。