免提电话可由个人和商业以多种设置来使用,以促进多方之间的 通信并提供免提设置。通常在
汽车中使用免提电话,以便当用户驾驶 汽车时无需处理接收机。多数免提电话都是半双工免提电话,其中每 次仅有一方能够占用通信信道。一旦一方获得信道,另一方必须等待, 直至信道空闲从而能够继续。
如果在噪声电平突然增加的环境中使用免提电话,输出的音频暂 时会变为静音。例如,在汽车中,汽车
加速增加了整体噪声电平,因 此当汽车开动时,输出音频会静音8到10秒的一段时间。
静音是由于输入语音触发检测器(VAD)将该突然的噪声增加检 测为近端话音造成的。由于VAD检测话音而非噪声,所以它
锁定了 输入信道。VAD大约耗时8到10秒恢复到正常操作。VAD无法快速 地适应于对背景噪声电平的增加的识别。这导致噪声电平闯入并锁定 信道。因此,需要一种技术来更加快速地检测出增加的噪声电平,并 释放信道以用于潜在的输出用途,避免阻碍输出话音。
因此,为克服上述
缺陷,本发明的一个方面提供一种动态估计背 景噪声的方法。该方法包括产生用于输入语音
帧的周期指示器以及当 前适度噪声电平;如果当前适度噪声电平等于前一适度噪声电平,比 较该周期指示器和预定
阈值;并如果该周期指示器超过该预定阈值则 维持背景噪声估计,如果周期指示器未超过该预定阈值则
修改背景噪 声估计。
另一方面,本发明包括一种检测半双工免提电话环境中噪声电平 的增加以避免阻碍输出话音的方法。该方法包括确定当前适度噪声电 平;比较当前适度噪声电平和前一适度噪声电平;如果当前适度噪声 电平等于该前一适度噪声电平,确定当前周期指示器是否大于预定阈 值;并如果该周期指示器超过该预定阈值则维持背景噪声估计,如果 当前周期指示器未超过该预定阈值则修改背景噪声估计并使输出信道 保持开放。
另一方面,本发明包括一种动态检测背景噪声的系统。该系统包 括便携式通信装置,用于接收输入信息,以及声码器,用于确定与该 输入信息相关的参数。该参数包括指示输入信息周期的发音模式。该 系统还包括语音触发检测器,用于处理这些参数以确定背景噪声估 计。该语音触发检测器包括比较当前发音模式和预定阈值的机制,其 中除非该发音模式超过该预定阈值,否则输出信道保持开放。
附图说明
图1示出蜂窝通信系统图;
图2是便携式通信装置的
框图;
图3是图示动态估计背景噪声的方法的
流程图;以及
图4是图示噪声电平和阈值的图表。
虽然本说明最后归结为对本发明的被认为是新颖的特点进行定义 的
权利要求,相信考虑以下结合附图的说明会更好的理解本发明,在 附图中沿用相同的参考标记。通常在音频设备中,话音和其他音频数 据被分为帧。在各个帧中包括各种参数,例如
能量参数和发音模式参 数。发音模式参数是指示
音调成分或帧周期的值。通常,较小的发音 模式值表示摩擦音,而较高值表示音调音,例如元音。
上述这些参数可由发射设备产生从而接收该信息的便携式通信装 置具有可用的参数。可选的,接收装置可计算上述标识出的参数。接 收便携式通信装置进一步使用这些参数值定义平均值和阈值。
参考图1,蜂窝通信系统100包括便携式通信装置102。通信系 统100可进一步包括固定网络设备(FNE)104,FNE104可包括可操 作的连接到公共交换电话网络(PSTN)108的移动交换中心(MSC) 106以及代码转换器110。代码转换器110用任何已知声码编码
算法 将音频数据转换为声码编码信息。代码转换器110可对输出音频
信号 进行声码编码并将其提供给在便携式通信装置102附近的基站112。 基站112可包括收发机设备以及天线114,将声码
编码信号通过该天 线传送到便携式通信装置102。
图2是显示根据本发明一个
实施例的可在免提电话模式下工作的 便携式通信装置102的图。便携式通信装置102包括连接到天线
开关 204的天线202。天线开关204选择性的将天线202耦合到接收机206 和发射机208。接收机206以及发射机208都被连接到
数字信号处理 器(DSP)210。DSP210提供用于计算以及提供数值的机制,并可执 行诸如声码编码的功能。DSP210可将接收的音频信息传送到音频输 出
电路212,从而通过扬声器214播放。便携式通信装置102还包括 音频输入电路218,用于处理从麦克
风220接收的音频信息。音频输 入218以及音频输出212电路可以是独立的或组合在单个编
解码器 中。音频输入电路218将信号传送到DSP210,DSP210执行诸如编码 和
基带处理的功能。发射机208调制DSP210提供的基带信号并将输 入信号发射到基站112。
便携式通信装置102还包括语音触发检测器116。DSP或声码器 210输出与输入信息相关的多个参数。这些参数之一是“r0”,它指 示话音段中的能量值。较高r0指示较大话音,而较低r0指示较小话 音。这些参数中的另一个是Vm或发音模式。发音模式指示输入信息 段的周期是多少。周期性话音具有较高发音模式。元音具有较高发音 模式。除了没有任何模式的话音之外,噪声也具有较低发音模式。因 此,总的来说,高发音模式表示存在话音。
声码器210输出的另一个参数是适度噪声电平“CNR0”。由于 传输静默是浪费的,所以声码器210估计适度噪声并当没有检测到话 音时传输CNR0。
如上所述,
现有技术的问题在于当背景噪声增加时,便携式通信 装置102不能在CNR0中记录该即时增加。然而,r0的增加并没有被 延迟,因此当不存在话音时宣称有8到10秒的话音。因此,本系统 和方法致
力于更好的估计CNR0。对CNR0曲线给出“Ib_r0_avg”这 一名称。
由于不能立即识别出CNR0的增加,所以本发明的包括VAD116 在内的处理工具对各个相继的输入信息段的CNR0进行比较。如果 CNR0没有改变也就是在两段之间相等,处理工具进一步调查以确定 是否存在任何的CNR0增加。在下面相对于本发明的方法进一步说明 该调查处理。
用于动态估计背景噪声从而避免锁定输出信道的方法在图3中详 细显示。在步骤300,在便携式通信装置102接收输入语音帧之后, 它比较输入语音帧的CNR0和前一语音帧的CNR0。
如果两个语音帧的CNR0不相等,在步骤302,VAD116将 ib_r0_avg设定为等于当前CNR0:
(1)ib_r0_avg(n)=CNR0(n)
并将ib_vm_avg设定为发音模式的当前值。
(2)ib_vm_avg(n)=Vm(n)
然而,如果步骤300中两个语音帧的CNR0相等,需要进一步的 调查,因为该相等可能是由于延迟的响应。
因此,在步骤304,VAD116确定当前Vm是否小于ib_vm_avg。 如果VAD116确定当前Vm小于ib_vm_avg,VAD116在步骤306中 用平滑因数“alpha”修正ib_vm_avg。更具体的,VAD116采用以下 公式:
(3)ib_vm_avg(n)=ib_vm_alphax Vm(n)+(1-
ib_vm_alpha)xib_vm_avg(n-1)
如果在步骤304,VAD116确定Vm不小于ib_vm_avg,VAD在 步骤308将ib_vm_avg设为等于当前Vm:
(4)ib_vm_avg(n)=Vm(n)
在步骤306和308之后,VAD116在步骤310确定ib_vm_avg是 否大于阈值ib_vm_thresh。如果平滑后的发音模式ib_vm_avg大于阈 值ib_vm_thresh,无需调整。然而如果ib_vm_avg不大于ib_vm_thresh, 则必须更新背景噪声估计。如果平滑后的发音模式小于阈值,则对该 语音帧的能量进行低通滤波并将其用于估计背景噪声电平。这是基于 噪声具有低发音模式的假设。在噪声电平突然增高的情况中,发音模 式保持为低,因此更新阈值。阈值的更新防止将噪声能量检测为话音。 因此,在步骤312,VAD116更新ib_r0_avg:
(5)ib_r0_avg(n)=(1-ib_r0_avg_alpha)x ib_r0_avg(n-1)+ ib_r0_avg_alphaxr0
为准确检测输入话音,将平滑后的输入能量和动态调整阈值比 较。该阈值是所述输入背景噪声的函数。背景噪声越大,该阈值就应 该越大,以避免检测失败。因此,本技术动态调整阈值,从而不会错 误检测输入VAD,甚至在极端噪声环境下。此种改编是基于语音帧的 发音模式以及该帧的能量的。
如以上图4所示,只要由实线代表的噪声曲线在阈值之下,不会 将噪声检测为话音,因此不会锁定信道。当噪声电平突然增加时,阈 值紧随噪声电平以防止其插入。用较长短划线表示原来的阈值。用较 短短划线表示新的阈值。如图所示,反映新的调整后的阈值的较短短 划线,随用实线表示的噪声电平更加快速调整。
使用发音模式估计背景噪声在多种实例中防止了错误检测话音。 在实施上述技术之前,当CNR0增加时,装置必须经历8-10秒的延迟。 而实施上述技术之后,相同装置内的延迟会降低到大约1/2秒。
虽然显示和说明了本发明的优选实施例,很清楚本发明不限于 此。本领域技术人员会作出多种修改、改变、变化、替换以及等同物, 而不背离由附随权利要求定义的本发明的精神和范围。