语音增强系统和方法
技术领域
[0001] 本
发明涉及一种用于房间中的语音增强的系统,该系统包括:用于从说话者的话音捕获音频
信号的麦克
风布置,用于处理所捕获的
音频信号的装置,以及位于房间中用于根据所处理的音频信号产生放大的声音的扬声器布置。
背景技术
[0002] 通过使用这种系统,可以放大说话者的话音,以为位于房间中的人增加语音清晰度,例如观众的收听者或者教室中的小学生/学生。这种语音增强系统经常遇到反馈问题,尤其是当与佩带式麦克风一起使用时(当说话者正在房间中移动时,反馈条件一直在改变,最低稳定增益必须被选择导致不良清晰度;另一方面,手动反馈消除器当处于反馈条件时降低了清晰度)。当使用悬挂式麦克风时(其需要较小增益,因为它们与说话者的嘴挨得非常近),反馈问题不太严重;然而,大多数说话者喜欢使用佩带式麦克风,而不是悬挂式麦克风。
[0003] WO 2010/000878 A2中描述了语音增强系统的示例,其中,音频
信号处理包括反馈消除器,其分析捕获的音频信号,以确定是否存在由从扬声器布置到麦克风布置的声音的反馈引起的临界反馈级别(Larsen效应)。该反馈消除器将指示反馈条件存在或者不存在的状态信号输出到主控制单元,以便在出现反馈条件时降低系统增益。
[0004] DE 25 26 034 A1涉及
助听器,其中在通过自动增益控制(AGC)阶段之后,麦克风信号经受10Hz的频移,以降低反馈,从而可以将最大增益增加大约10dB。US 5,394,475涉及一种音频系统,提供音频信号的频移以降低反馈,其中,提到了频移可以是大约5Hz。
[0005] US 4,237,339涉及用于降低音频电信会议系统的反馈的定向麦克风的使用,其中,扬声器和麦克风刚性地安装在吊杆上,并且麦克风相对于扬声器以方向性的空值
位置指向扬声器的方式进行
定位和定向。
[0006] EP 0 581 261 A1涉及用于降低助听器的反馈的维纳
滤波器的使用,其中,将该维纳滤波器实现为由用户操作控制所控制的滤波器的一部分。JP 2008-141734 A涉及用于降低非手持式电话系统或者视频会议系统中的反馈的维纳滤波器的使用。EP 1 429 315 A1涉及用于降低车辆通信系统中的反馈的维纳滤波器的使用。
发明内容
[0007] 本发明的目的是提供一种语音增强系统和方法,其具有对反馈非常小的灵敏度,从而可以与佩带式麦克风一起使用。
[0008] 根据本发明,为了实现这个目的,本发明提供了一种用于房间(10)中的语音增强的系统,包括:定向的佩带式麦克风布置,其用于从说话者的话音捕获音频信号;
音频信号处理装置(32,34,38,38',56,70),其用于根据捕获到的音频信号产生处理后的音频信号,包括:自适应波束形成器单元(32),其用于将
指向性告知所述麦克风布置,其中,最大灵敏度是朝向说话者的嘴(21),并且最小灵敏度是朝向由所述波束形成器单元识别出的噪声源,单元(38,38'),其用于仅对高于
频率阈值的音频信号的分量进行频移,反馈消除单元(56),其包括自适应滤波器和选择单元(68),所述选择单元(68)适于在第一模式和第二模式之间自动地切换,其中,在第一模式中,当总的声学增益或者反馈低于临界值时,音频信号绕过所述自适应滤波器,在第二模式中,当总的声学增益或者反馈高于所述临界值时,由所述自适应滤波器过滤所述音频信号;位于所述房间中的扬声器布置(24),其用于根据处理后的音频信号产生声音,并且包括被布置形成定向扬声器阵列的多个扬声器(25)。
[0009] 本发明还提供了一种房间(10)中的语音增强的方法,包括:通过定向的佩带式麦克风布置(12)从说话者的话音捕获音频信号,处理所捕获的音频信号以产生处理后的音频信号,所述处理包括:通过用以下方式对所捕获的音频信号应用自适应波束形成来识别噪声源并且将指向性告知所述麦克风布置:所述麦克风布置的最大灵敏度是朝向说话者的嘴(21),并且最小灵敏度是朝向所识别出的噪声源,仅对高于阈值的音频信号的分量进行频移,对音频信号应用反馈消除,包括音频信号绕过维纳滤波器的第一模式和由所述维纳滤波器过滤音频信号的第二模式,其中,当总的声学增益或者反馈低于临界值时自动切换到所述第一模式,并且如果总的声学增益或者反馈高于所述临界值则自动切换到所述第二模式;以及根据处理后的音频信号由位于房间中的扬声器布置(24)产生声音,所述扬声器布置包括被布置形成定向的扬声器阵列的多个扬声器(25)。
[0010] 本发明的益处在于:通过提供定向的佩带式麦克风布置(其可以是物理的定向麦克风或者具有至少两个间隔开的麦克风的布置)和自适应波束形成器,其用于采用朝着说话者的嘴的最大灵敏度和朝着噪声源的最小灵敏度将指向性告知麦克风布置,提供扬声器布置作为定向扬声器阵列,对所捕获的音频信号的分量的一部分进行频移,以及通过提供自适应滤波器(诸如维纳滤波器),其根据临界反馈的存在或者不存在而被自动地接通和切断,可有效地改善该系统的反馈行为,从而允许以适合的增益使用佩带式麦克风布置,以改善在诸如教室之类的房间中的语音清晰度。通过仅对音频信号的
频谱的较高部分(典型地,超过850Hz)进行偏移,可以最小化由频移产生的可听的人为因素的存在;例如,频移可以是上移大约5Hz。通过在反馈消除器中提供自动
开关,即,仅当已确定出临界反馈条件时,通过自适应滤波器过滤音频信号,可以最小化由自适应滤波器的过滤产生的人为因素和降低的清晰度。
[0011] 在从属
权利要求中限定了本发明的优选
实施例。
附图说明
[0012] 以下,将参考附图图示本发明的示例,其中:
[0013] 图1是根据本发明的语音增强系统的示意性
框图;
[0014] 图2是根据本发明的语音增强系统的示例的示意表示;
[0015] 图3是根据本发明的语音增强系统的传送单元的框图;以及
[0016] 图4是图3的语音增强系统的接收器单元的框图。
具体实施方式
[0017] 图1是用于房间10中的语音增强的系统的示意图。该系统包括用于从说话者14的话音捕获音频信号的定向的佩带式麦克风12,其可以是实际的定向麦克风或者包括至少两个间隔开的声学
传感器的布置,所述信号被提供给单元16,单元16可以提供音频信号的预放大,并且在无线麦克风的情形中,单元16包括用于建立诸如模拟FM链路或者优选地数字链路(如无线电或红外线链路)之类的无线音频链路19的传送器,以及诸如声学波束形成器单元之类的音频信号处理部件。音频信号通过
电缆或者在无线麦克风的情形中经由音频信号接收器18提供到用于处理音频信号的音频信号处理单元20,尤其是为了对音频信号应用频谱过滤和增益控制。将处理后的音频信号提供给工作在恒定增益的功率
放大器22,以将放大的音频信号提供给扬声器布置24,从而根据处理后的音频信号来产生由听者26所
感知的放大了的声音。
[0018] 图2示意性地示出了根据本发明的语音增强系统的示例,其中,该系统被设计为无线系统,即,包括无线音频链路19,优选地例如在2.4GHz ISM波段操作的数字链路。该系统包括传送单元16,其被佩戴在说话者14的身上,具有包括两个纵向间隔开的麦克风12A和12B的佩带式麦克风布置12,其被佩戴在说话者的胸前并且经由电缆17连接到传送单元16。
该系统还包括接收器单元52,其连接到由多个扬声器25组成的扬声器阵列24,扬声器25以类似堆叠的方式在彼此上方垂直地排列。例如,扬声器布置24可以由12个垂直堆叠的扬声器25组成。
[0019] 优选地,扬声器阵列24的指向性是这样的:最大声音振幅/压
力的方向实际上
水平地取向,以便通过最小化房间10的
天花板11和地板13的反射来最小化房间混响。降低的混响导致降低反馈问题。另外,扬声器阵列24的这种水平指向性是有效率的,因为最小化了关于麦克风布置12的指向性的声耦合,该声耦合具有其朝着说话者14的嘴21,即,当佩戴在说话者的胸前时朝着
天花板11的最大灵敏度(在图2标记27表示了由声束形成实现的定向的佩带式麦克风设备12的孔径
角)。例如,由扬声器阵列24生成的声场的垂直孔径角23可以是在2kHz处的+/-7度,以及在500Hz处的+/-25度,同时,水平孔径角在+/-90度的范围之内。
[0020] 类似于图2所示的那样,在图3和4中示出了根据本发明的语音增强系统的示例的框图。
[0021] 定向的佩带式麦克风组件12优选地由两个间隔距离为d的全向麦克风12A和12B构成(当将麦克风布置12佩戴在用户胸前时,麦克风12A和12B主要按照垂直方向间隔开)。将由麦克风12A、12B捕获到的音频信号通过
模数转换器30A和30B分别转换为
数字信号,同时将数字信号提供给包括波束形成器的信号处理单元32,所述波束形成器用于以如下方式将指向性告知麦克风布置12:最大灵敏度朝向说话者的嘴21,即朝向天花板11,并且最小灵敏度朝向由波束形成器单元32识别出的噪声源。
[0022] 为此,信号处理单元32在捕获到的音频信号中不断地搜索噪声源,波束形成信号处理适用于这样的噪声源的方向。优选地,信号处理单元32单独地处理音频信号的不同的频带,以实现在不同频带中的不同的
指向性图案(即,在被处理之前,音频信号被分为多个频带);从而可以同时消减从不同方向产生噪声的不同的噪声源,假如它们的主噪声振幅不在相同的频带中。同样,由于来自扬声器阵列24的声音会被信号处理单元32分类为“噪声”,所以这样的指向性图案会导致改善该系统的反馈性能,同时消减“反馈噪声”。
[0023] 信号处理单元32还包括用于提供AGC以避免传送的音频信号过调制的增益模型。将来自信号处理单元32的第一输出提供给分析器单元36,其分析音频信号以提供与具体的可变增益功能有关的传送器参数(例如,单元36可以估算环绕噪声电平,以及提供表示周围噪声电平的
输出信号)。
[0024] 将信号处理单元32的第二输出提供给频移单元38,其对高于某一频率阈值的音频信号的分量进行频移,反之,低于这个阈值的分量保持不偏移。优选地,从500Hz至2kHz的范围内选择该阈值。例如,该阈值可以是850Hz。优选地,可以统一地对高于阈值的音频信号的分量进行频移,例如向上大约5Hz,该偏移尤其适合于典型的教室大小。
[0025] 通过仅偏移较高的声频,即,高于阈值的频率,可显著地降低在反馈条件的情况中存在的可听的人为因素。如果对整个声频范围应用频移,这将不会是这种情形(例如,100Hz处的5Hz偏移将是明显可听见的)。由于这种频移,可以在混响室内实现多达6dB的改进。
[0026] 传送单元16还包括控制单元40和作用于控制单元40的用户
接口42A、42B,例如按照升音和降音按钮的形式。传送单元16还可以包括其他功能,诸如LCD控制等,如图3的44所示。将离开频移单元38的音频信号和控制单元40的输出提供给单元46,该单元46混合来自单元38的音频数据和来自单元36的命令信号数据,并且将混合后的信号提供给无线电传送器48,无线电传送器48经由天线50通过无线链路19将信号传送到接收器单元52的无线电接收器18,同时天线54连接到接收器18。
[0027] 将由接收器18接收到的数据的音频信号部分提供给反馈消除器单元56,而将接收到的数据的传送器参数提供给单元58,单元58根据与具有可变增益的具体功能有关的接收到的参数,确定待应用到接收到的音频信号的附加增益。将包括在接收到的数据中的音量控制数据提供给音量控制单元60,用于向增益控制单元62提供相应的输入,增益控制单元62还从单元58接收关于附加增益的输入。来自用户接口61A、61B的可选输入也作用于增益控制单元62,按照本地升音和降音按钮的形式。
[0028] 增益控制单元62作用于反馈消除器单元56,以根据传送单元16的用户接口42A、42B的音量设置,和根据单元58中处理的传送器参数以及根据接收器单元52的用户接口
61A、61B的音量设置,来调整对接收到的音频信号所应用的增益。
[0029] 反馈消除器单元56包括时域增益控制单元64、频域滤波器单元66和时/频域选择单元68。滤波器单元66包括诸如维纳滤波器之类的自适应滤波器,其工作在频域并且使用FFT(快速傅里叶变换)和IFFT(快速傅里叶逆变换),用于将音频信号从时域转换为频域,并且再次转换为时域。滤波器单元66还将反馈状态信号输出到时域增益控制单元64,该反馈状态信号表示反馈条件的存在或不存在。将离开时域增益控制单元64的时域音频信号作为输入提供给滤波器单元66和作为第一输入提供给时/频域选择单元68。将离开滤波器单元66的时域音频信号作为第二输入提供给时/频域选择单元68。提供给时域增益控制单元64的反馈状态信号用来降低在临界反馈条件的情形中的系统增益。
[0030] 增益控制单元62将表示系统增益的增益状态信号提供给时/频域选择单元68,同时,选择单元68选择从时域增益控制单元64提供的时域音频信号,即绕过滤波器单元66的时域音频信号,作为在总的声学增益低于预定临界值的情况下被提供给频率响应均衡器单元70的信号,并且它选择由滤波器单元66过滤的音频信号,作为在总的声学增益高于预定的临界值的情况下被提供给频率响应均衡器单元70的输出。因此,反馈消除器单元56在音频信号绕过滤波器单元66的第一模式和由滤波器单元66过滤音频信号的第二模式之间自动地切换,同时,自动发生的模式切换与总的声学增益有关。对于典型的房间,可以固定在选择单元68中使用的总的声学增益的预定的临界值,或者可选地,所述临界值可以与由房间10的声学参数限定的房间参数有关。可以从单元69提供这样的房间参数。
[0031] 另选地,可以通过反馈检测器使用由滤波器单元66提供的反馈状态信号控制该切换,即,模式切换的出现取决于检测到的反馈是低于还是高于预定的临界值。然而,可靠的反馈检测比依赖增益的切换更难以实现,从而优选地,通过如图4所示的增益状态信号控制选择单元68。
[0032] 当反馈消除器单元56中的音频信号绕过滤波器单元66时,可以最小化由信号处理和滤波器单元66中的信号过滤所引起的人为因素,并且可使清晰度最佳。在相对高的增益即接近反馈的情形中,通过滤波器单元66的音频信号的过滤用来降低反馈,从而允许比没有自适应滤波器更高的增益。
[0033] 主要通过比较高频率消减较少的较低音频的反射来产生房间混响。在远场中(例如,离扬声器几米),在限定的房间和限定的测试信号中,混响的级别本质上是恒定的。房间中的高混响降低了清晰度,并且导致由于通过麦克风拾取混响引起的反馈问题。
[0034] 为了最小化带有语音的房间混响级别,在低于频率界限的低频范围中应用的增益比在高于频率界限的高频范围中应用的增益低。优选地,该频率界限是大约1kHz。使用均衡器单元70实现这种频率响应。通过实现这种频率响应,可以在反馈不会出现在更低频的意义上获得良好的清晰度,并且可以使反馈性能最佳,因为降低了这个更低频中的总的声学增益,而相反将会被推向更高频,其中通过单元38应用频移,以降低更高频处的反馈。
[0035] 将离开频率响应均衡器单元70的音频信号提供给
功率放大器22,用于以恒定增益放大该音频信号,将放大了的音频信号提供给扬声器布置24。必须考虑由功率放大器22提供的扬声器布置24的声学增益,以限定选择单元68中使用的总的声学增益的预定临界值。
[0036] 虽然图中仅示出了一个扬声器布置/阵列,但是应当理解的是,该系统可以包括一个以上的扬声器布置/阵列。
[0037] 代替在传送单元16中设置频移单元38,另选地可以在接收器单元52中设置为单元38'(图4中的虚线所示),以在将接收到的音频信号提供给反馈消除器单元56之前先处理该音频信号。
[0038] 代替在接收器单元52中设置反馈消除器单元56,可以在传送单元16中设置。
[0039] 单元56和70(以及单元38'(如果存在的话))构成接收器单元52的音频信号处理单元20。
[0040] 在所有实施例中,传送单元16可兼容于具有无线音频接口的助听器,诸如具有经由音频
底板连接到助听器的FM(或DM)接收器单元的助听器或者具有集成的FM(或者DM)接收器的助听器。