用于背景噪声快速动态估计的方法专利检索-阈值单位和数量专利检索查询-专利查询网

用于背景噪声快速动态估计的方法

阅读：680发布：2023-02-26

专利汇可以提供用于背景噪声快速动态估计的方法专利检索，专利查询，专利分析的服务。并且本发明提供一种动态估计背景噪声的方法和系统。该系统包括便携式通信装置，声码器以及语音触发检测器。根据便携式通信装置接收到的信息，声码器确定和输入信息相关的参数，包括指示输入信息周期的发音模式。然后语音触发检测器比较发音模式和阈值以确定是否更新背景噪声估计。该方法包括步骤：接收输入语音帧的周期指示器和当前适度噪声电平；如果当前适度噪声电平等于前一适度噪声电平，比较周期指示器和预定阈值；并如果周期指示器超过预定阈值则维持背景噪声估计，如果周期指示器未超过预定阈值，则修正背景噪声估计。，下面是用于背景噪声快速动态估计的方法专利的具体信息内容。

权利要求

1.一种动态估计背景噪声的方法，包括：
产生输入语音帧的周期指示器和当前适度噪声电平；
如果当前适度噪声电平等于前一适度噪声电平，将该周期指示器与预定阈值进行比较；
如果周期指示器超过预定阈值则维持背景噪声估计，并如果周期指示器未超过预定阈值则修正背景噪声估计。
2.权利要求1的方法，进一步包括：
如果当前适度噪声电平不等于前一适度噪声电平，则设定背景噪声估计以及平均周期估计。
3.权利要求1的方法，进一步包括在比较周期指示器和预定阈值之前计算平滑后的周期指示器。
4.权利要求1的方法，进一步包括如果周期指示器未超过预定阈值则保持输出信道开放。
5.一种在半双工免提电话环境中检测噪声电平增高从而避免阻碍输出话音的方法，该方法包括：
确定当前适度噪声电平；
比较当前适度噪声电平和前一适度噪声电平；
如果当前适度噪声电平等于前一适度噪声电平则确定当前周期指示器是否大于预定阈值；以及
如果周期指示器超过预定阈值则维持背景噪声估计，并如果周期指示器未超过预定阈值则修正背景噪声估计。
6.权利要求5的方法，进一步包括：
如果当前适度噪声电平不等于前一适度噪声电平则设定背景噪声估计和平均周期估计。
7.权利要求5的方法，进一步包括在比较周期指示器和预定阈值之前计算平滑后的周期指示器。
8.权利要求5的方法，进一步包括如果周期指示器未超过预定阈值则更新背景噪声估计。
9.一种动态估计背景噪声的系统，该系统包括：
便携式通信装置，用于接收输入信息；
声码器，用于确定和该输入信息相关的参数，这些参数包括指示输入信息周期的发音模式；
语音触发检测器，用于处理这些参数以确定背景噪声估计，语音触发检测器包括比较当前发音模式和预定阈值的机制，其中除非发音模式超过该预定阈值，否则输出信道保持开放。
10.权利要求9的系统，进一步包括：
如果当前适度噪声电平不等于前一适度噪声电平则设定背景噪声估计以及平均周期估计。

说明书全文

技术领域

本发明一般来讲涉及移动单元，更具体的，涉及可在免提电话模式下工作的便携式通信装置。

背景技术

免提电话可由个人和商业以多种设置来使用，以促进多方之间的通信并提供免提设置。通常在汽车中使用免提电话，以便当用户驾驶汽车时无需处理接收机。多数免提电话都是半双工免提电话，其中每次仅有一方能够占用通信信道。一旦一方获得信道，另一方必须等待，直至信道空闲从而能够继续。
如果在噪声电平突然增加的环境中使用免提电话，输出的音频暂时会变为静音。例如，在汽车中，汽车加速增加了整体噪声电平，因此当汽车开动时，输出音频会静音8到10秒的一段时间。
静音是由于输入语音触发检测器(VAD)将该突然的噪声增加检测为近端话音造成的。由于VAD检测话音而非噪声，所以它锁定了输入信道。VAD大约耗时8到10秒恢复到正常操作。VAD无法快速地适应于对背景噪声电平的增加的识别。这导致噪声电平闯入并锁定信道。因此，需要一种技术来更加快速地检测出增加的噪声电平，并释放信道以用于潜在的输出用途，避免阻碍输出话音。

发明内容

因此，为克服上述缺陷，本发明的一个方面提供一种动态估计背景噪声的方法。该方法包括产生用于输入语音帧的周期指示器以及当前适度噪声电平；如果当前适度噪声电平等于前一适度噪声电平，比较该周期指示器和预定阈值；并如果该周期指示器超过该预定阈值则维持背景噪声估计，如果周期指示器未超过该预定阈值则修改背景噪声估计。
另一方面，本发明包括一种检测半双工免提电话环境中噪声电平的增加以避免阻碍输出话音的方法。该方法包括确定当前适度噪声电平；比较当前适度噪声电平和前一适度噪声电平；如果当前适度噪声电平等于该前一适度噪声电平，确定当前周期指示器是否大于预定阈值；并如果该周期指示器超过该预定阈值则维持背景噪声估计，如果当前周期指示器未超过该预定阈值则修改背景噪声估计并使输出信道保持开放。
另一方面，本发明包括一种动态检测背景噪声的系统。该系统包括便携式通信装置，用于接收输入信息，以及声码器，用于确定与该输入信息相关的参数。该参数包括指示输入信息周期的发音模式。该系统还包括语音触发检测器，用于处理这些参数以确定背景噪声估计。该语音触发检测器包括比较当前发音模式和预定阈值的机制，其中除非该发音模式超过该预定阈值，否则输出信道保持开放。
附图说明
图1示出蜂窝通信系统图；
图2是便携式通信装置的框图；
图3是图示动态估计背景噪声的方法的流程图；以及
图4是图示噪声电平和阈值的图表。

具体实施方式

虽然本说明最后归结为对本发明的被认为是新颖的特点进行定义的权利要求，相信考虑以下结合附图的说明会更好的理解本发明，在附图中沿用相同的参考标记。通常在音频设备中，话音和其他音频数据被分为帧。在各个帧中包括各种参数，例如能量参数和发音模式参数。发音模式参数是指示音调成分或帧周期的值。通常，较小的发音模式值表示摩擦音，而较高值表示音调音，例如元音。
上述这些参数可由发射设备产生从而接收该信息的便携式通信装置具有可用的参数。可选的，接收装置可计算上述标识出的参数。接收便携式通信装置进一步使用这些参数值定义平均值和阈值。
参考图1，蜂窝通信系统100包括便携式通信装置102。通信系统100可进一步包括固定网络设备(FNE)104，FNE104可包括可操作的连接到公共交换电话网络(PSTN)108的移动交换中心(MSC) 106以及代码转换器110。代码转换器110用任何已知声码编码算法将音频数据转换为声码编码信息。代码转换器110可对输出音频信号进行声码编码并将其提供给在便携式通信装置102附近的基站112。基站112可包括收发机设备以及天线114，将声码编码信号通过该天线传送到便携式通信装置102。
图2是显示根据本发明一个实施例的可在免提电话模式下工作的便携式通信装置102的图。便携式通信装置102包括连接到天线开关 204的天线202。天线开关204选择性的将天线202耦合到接收机206 和发射机208。接收机206以及发射机208都被连接到数字信号处理器(DSP)210。DSP210提供用于计算以及提供数值的机制，并可执行诸如声码编码的功能。DSP210可将接收的音频信息传送到音频输出电路212，从而通过扬声器214播放。便携式通信装置102还包括音频输入电路218，用于处理从麦克风220接收的音频信息。音频输入218以及音频输出212电路可以是独立的或组合在单个编解码器中。音频输入电路218将信号传送到DSP210，DSP210执行诸如编码和基带处理的功能。发射机208调制DSP210提供的基带信号并将输入信号发射到基站112。
便携式通信装置102还包括语音触发检测器116。DSP或声码器 210输出与输入信息相关的多个参数。这些参数之一是“r0”，它指示话音段中的能量值。较高r0指示较大话音，而较低r0指示较小话音。这些参数中的另一个是Vm或发音模式。发音模式指示输入信息段的周期是多少。周期性话音具有较高发音模式。元音具有较高发音模式。除了没有任何模式的话音之外，噪声也具有较低发音模式。因此，总的来说，高发音模式表示存在话音。
声码器210输出的另一个参数是适度噪声电平“CNR0”。由于传输静默是浪费的，所以声码器210估计适度噪声并当没有检测到话音时传输CNR0。
如上所述，现有技术的问题在于当背景噪声增加时，便携式通信装置102不能在CNR0中记录该即时增加。然而，r0的增加并没有被延迟，因此当不存在话音时宣称有8到10秒的话音。因此，本系统和方法致力于更好的估计CNR0。对CNR0曲线给出“Ib_r0_avg”这一名称。
由于不能立即识别出CNR0的增加，所以本发明的包括VAD116 在内的处理工具对各个相继的输入信息段的CNR0进行比较。如果 CNR0没有改变也就是在两段之间相等，处理工具进一步调查以确定是否存在任何的CNR0增加。在下面相对于本发明的方法进一步说明该调查处理。
用于动态估计背景噪声从而避免锁定输出信道的方法在图3中详细显示。在步骤300，在便携式通信装置102接收输入语音帧之后，它比较输入语音帧的CNR0和前一语音帧的CNR0。
如果两个语音帧的CNR0不相等，在步骤302，VAD116将 ib_r0_avg设定为等于当前CNR0：
(1)ib_r0_avg(n)＝CNR0(n)
并将ib_vm_avg设定为发音模式的当前值。
(2)ib_vm_avg(n)＝Vm(n)
然而，如果步骤300中两个语音帧的CNR0相等，需要进一步的调查，因为该相等可能是由于延迟的响应。
因此，在步骤304，VAD116确定当前Vm是否小于ib_vm_avg。如果VAD116确定当前Vm小于ib_vm_avg，VAD116在步骤306中用平滑因数“alpha”修正ib_vm_avg。更具体的，VAD116采用以下公式：
(3)ib_vm_avg(n)＝ib_vm_alphax Vm(n)+(1-
ib_vm_alpha)xib_vm_avg(n-1)
如果在步骤304，VAD116确定Vm不小于ib_vm_avg，VAD在步骤308将ib_vm_avg设为等于当前Vm：
(4)ib_vm_avg(n)＝Vm(n)
在步骤306和308之后，VAD116在步骤310确定ib_vm_avg是否大于阈值ib_vm_thresh。如果平滑后的发音模式ib_vm_avg大于阈值ib_vm_thresh，无需调整。然而如果ib_vm_avg不大于ib_vm_thresh，则必须更新背景噪声估计。如果平滑后的发音模式小于阈值，则对该语音帧的能量进行低通滤波并将其用于估计背景噪声电平。这是基于噪声具有低发音模式的假设。在噪声电平突然增高的情况中，发音模式保持为低，因此更新阈值。阈值的更新防止将噪声能量检测为话音。因此，在步骤312，VAD116更新ib_r0_avg：
(5)ib_r0_avg(n)＝(1-ib_r0_avg_alpha)x ib_r0_avg(n-1)+ ib_r0_avg_alphaxr0
为准确检测输入话音，将平滑后的输入能量和动态调整阈值比较。该阈值是所述输入背景噪声的函数。背景噪声越大，该阈值就应该越大，以避免检测失败。因此，本技术动态调整阈值，从而不会错误检测输入VAD，甚至在极端噪声环境下。此种改编是基于语音帧的发音模式以及该帧的能量的。
如以上图4所示，只要由实线代表的噪声曲线在阈值之下，不会将噪声检测为话音，因此不会锁定信道。当噪声电平突然增加时，阈值紧随噪声电平以防止其插入。用较长短划线表示原来的阈值。用较短短划线表示新的阈值。如图所示，反映新的调整后的阈值的较短短划线，随用实线表示的噪声电平更加快速调整。
使用发音模式估计背景噪声在多种实例中防止了错误检测话音。在实施上述技术之前，当CNR0增加时，装置必须经历8-10秒的延迟。而实施上述技术之后，相同装置内的延迟会降低到大约1/2秒。
虽然显示和说明了本发明的优选实施例，很清楚本发明不限于此。本领域技术人员会作出多种修改、改变、变化、替换以及等同物，而不背离由附随权利要求定义的本发明的精神和范围。

标题	发布/更新时间	阅读量
阈值电压分析	2020-05-11	943
阈值选择方法及设备	2020-05-13	747
一种可编程阈值电路	2020-05-13	12
阈值确定装置和阈值确定方法	2020-05-12	883
读阈值设置方法与装置	2020-05-13	1046
阈值检测设备	2020-05-11	184
表示LSP切换阈值的LDP切换阈值TLV	2020-05-12	402
振幅阈值检测器	2020-05-11	532
阈值的测试和确定	2020-05-12	207
轮胎阈值阀	2020-05-11	822

用于背景噪声快速动态估计的方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：