首页 / 专利库 / 单位和数量 / 阈值 / 用于背景噪声快速动态估计的方法

用于背景噪声快速动态估计的方法

阅读:680发布:2023-02-26

专利汇可以提供用于背景噪声快速动态估计的方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种动态估计背景噪声的方法和系统。该系统包括便携式通信装置,声码器以及语音触发检测器。根据便携式通信装置接收到的信息,声码器确定和输入信息相关的参数,包括指示输入信息周期的发音模式。然后语音触发检测器比较发音模式和 阈值 以确定是否更新背景噪声估计。该方法包括步骤:接收输入语音 帧 的周期指示器和当前适度噪声电平;如果当前适度噪声电平等于前一适度噪声电平,比较周期指示器和预定阈值;并如果周期指示器超过预定阈值则维持背景噪声估计,如果周期指示器未超过预定阈值,则修正背景噪声估计。,下面是用于背景噪声快速动态估计的方法专利的具体信息内容。

1.一种动态估计背景噪声的方法,包括:
产生输入语音的周期指示器和当前适度噪声电平;
如果当前适度噪声电平等于前一适度噪声电平,将该周期指示器 与预定阈值进行比较;
如果周期指示器超过预定阈值则维持背景噪声估计,并如果周期 指示器未超过预定阈值则修正背景噪声估计。
2.权利要求1的方法,进一步包括:
如果当前适度噪声电平不等于前一适度噪声电平,则设定背景噪 声估计以及平均周期估计。
3.权利要求1的方法,进一步包括在比较周期指示器和预定阈 值之前计算平滑后的周期指示器。
4.权利要求1的方法,进一步包括如果周期指示器未超过预定 阈值则保持输出信道开放。
5.一种在半双工免提电话环境中检测噪声电平增高从而避免阻 碍输出话音的方法,该方法包括:
确定当前适度噪声电平;
比较当前适度噪声电平和前一适度噪声电平;
如果当前适度噪声电平等于前一适度噪声电平则确定当前周期指 示器是否大于预定阈值;以及
如果周期指示器超过预定阈值则维持背景噪声估计,并如果周期 指示器未超过预定阈值则修正背景噪声估计。
6.权利要求5的方法,进一步包括:
如果当前适度噪声电平不等于前一适度噪声电平则设定背景噪声 估计和平均周期估计。
7.权利要求5的方法,进一步包括在比较周期指示器和预定阈 值之前计算平滑后的周期指示器。
8.权利要求5的方法,进一步包括如果周期指示器未超过预定 阈值则更新背景噪声估计。
9.一种动态估计背景噪声的系统,该系统包括:
便携式通信装置,用于接收输入信息;
声码器,用于确定和该输入信息相关的参数,这些参数包括指示 输入信息周期的发音模式;
语音触发检测器,用于处理这些参数以确定背景噪声估计,语音 触发检测器包括比较当前发音模式和预定阈值的机制,其中除非发音 模式超过该预定阈值,否则输出信道保持开放。
10.权利要求9的系统,进一步包括:
如果当前适度噪声电平不等于前一适度噪声电平则设定背景噪声 估计以及平均周期估计。

说明书全文

技术领域

发明一般来讲涉及移动单元,更具体的,涉及可在免提电话模 式下工作的便携式通信装置。

背景技术

免提电话可由个人和商业以多种设置来使用,以促进多方之间的 通信并提供免提设置。通常在汽车中使用免提电话,以便当用户驾驶 汽车时无需处理接收机。多数免提电话都是半双工免提电话,其中每 次仅有一方能够占用通信信道。一旦一方获得信道,另一方必须等待, 直至信道空闲从而能够继续。
如果在噪声电平突然增加的环境中使用免提电话,输出的音频暂 时会变为静音。例如,在汽车中,汽车加速增加了整体噪声电平,因 此当汽车开动时,输出音频会静音8到10秒的一段时间。
静音是由于输入语音触发检测器(VAD)将该突然的噪声增加检 测为近端话音造成的。由于VAD检测话音而非噪声,所以它定了 输入信道。VAD大约耗时8到10秒恢复到正常操作。VAD无法快速 地适应于对背景噪声电平的增加的识别。这导致噪声电平闯入并锁定 信道。因此,需要一种技术来更加快速地检测出增加的噪声电平,并 释放信道以用于潜在的输出用途,避免阻碍输出话音。

发明内容

因此,为克服上述缺陷,本发明的一个方面提供一种动态估计背 景噪声的方法。该方法包括产生用于输入语音的周期指示器以及当 前适度噪声电平;如果当前适度噪声电平等于前一适度噪声电平,比 较该周期指示器和预定阈值;并如果该周期指示器超过该预定阈值则 维持背景噪声估计,如果周期指示器未超过该预定阈值则修改背景噪 声估计。
另一方面,本发明包括一种检测半双工免提电话环境中噪声电平 的增加以避免阻碍输出话音的方法。该方法包括确定当前适度噪声电 平;比较当前适度噪声电平和前一适度噪声电平;如果当前适度噪声 电平等于该前一适度噪声电平,确定当前周期指示器是否大于预定阈 值;并如果该周期指示器超过该预定阈值则维持背景噪声估计,如果 当前周期指示器未超过该预定阈值则修改背景噪声估计并使输出信道 保持开放。
另一方面,本发明包括一种动态检测背景噪声的系统。该系统包 括便携式通信装置,用于接收输入信息,以及声码器,用于确定与该 输入信息相关的参数。该参数包括指示输入信息周期的发音模式。该 系统还包括语音触发检测器,用于处理这些参数以确定背景噪声估 计。该语音触发检测器包括比较当前发音模式和预定阈值的机制,其 中除非该发音模式超过该预定阈值,否则输出信道保持开放。
附图说明
图1示出蜂窝通信系统图;
图2是便携式通信装置的框图
图3是图示动态估计背景噪声的方法的流程图;以及
图4是图示噪声电平和阈值的图表。

具体实施方式

虽然本说明最后归结为对本发明的被认为是新颖的特点进行定义 的权利要求,相信考虑以下结合附图的说明会更好的理解本发明,在 附图中沿用相同的参考标记。通常在音频设备中,话音和其他音频数 据被分为帧。在各个帧中包括各种参数,例如能量参数和发音模式参 数。发音模式参数是指示音调成分或帧周期的值。通常,较小的发音 模式值表示摩擦音,而较高值表示音调音,例如元音。
上述这些参数可由发射设备产生从而接收该信息的便携式通信装 置具有可用的参数。可选的,接收装置可计算上述标识出的参数。接 收便携式通信装置进一步使用这些参数值定义平均值和阈值。
参考图1,蜂窝通信系统100包括便携式通信装置102。通信系 统100可进一步包括固定网络设备(FNE)104,FNE104可包括可操 作的连接到公共交换电话网络(PSTN)108的移动交换中心(MSC) 106以及代码转换器110。代码转换器110用任何已知声码编码算法 将音频数据转换为声码编码信息。代码转换器110可对输出音频信号 进行声码编码并将其提供给在便携式通信装置102附近的基站112。 基站112可包括收发机设备以及天线114,将声码编码信号通过该天 线传送到便携式通信装置102。
图2是显示根据本发明一个实施例的可在免提电话模式下工作的 便携式通信装置102的图。便携式通信装置102包括连接到天线开关 204的天线202。天线开关204选择性的将天线202耦合到接收机206 和发射机208。接收机206以及发射机208都被连接到数字信号处理 器(DSP)210。DSP210提供用于计算以及提供数值的机制,并可执 行诸如声码编码的功能。DSP210可将接收的音频信息传送到音频输 出电路212,从而通过扬声器214播放。便携式通信装置102还包括 音频输入电路218,用于处理从麦克220接收的音频信息。音频输 入218以及音频输出212电路可以是独立的或组合在单个编解码器 中。音频输入电路218将信号传送到DSP210,DSP210执行诸如编码 和基带处理的功能。发射机208调制DSP210提供的基带信号并将输 入信号发射到基站112。
便携式通信装置102还包括语音触发检测器116。DSP或声码器 210输出与输入信息相关的多个参数。这些参数之一是“r0”,它指 示话音段中的能量值。较高r0指示较大话音,而较低r0指示较小话 音。这些参数中的另一个是Vm或发音模式。发音模式指示输入信息 段的周期是多少。周期性话音具有较高发音模式。元音具有较高发音 模式。除了没有任何模式的话音之外,噪声也具有较低发音模式。因 此,总的来说,高发音模式表示存在话音。
声码器210输出的另一个参数是适度噪声电平“CNR0”。由于 传输静默是浪费的,所以声码器210估计适度噪声并当没有检测到话 音时传输CNR0。
如上所述,现有技术的问题在于当背景噪声增加时,便携式通信 装置102不能在CNR0中记录该即时增加。然而,r0的增加并没有被 延迟,因此当不存在话音时宣称有8到10秒的话音。因此,本系统 和方法致于更好的估计CNR0。对CNR0曲线给出“Ib_r0_avg”这 一名称。
由于不能立即识别出CNR0的增加,所以本发明的包括VAD116 在内的处理工具对各个相继的输入信息段的CNR0进行比较。如果 CNR0没有改变也就是在两段之间相等,处理工具进一步调查以确定 是否存在任何的CNR0增加。在下面相对于本发明的方法进一步说明 该调查处理。
用于动态估计背景噪声从而避免锁定输出信道的方法在图3中详 细显示。在步骤300,在便携式通信装置102接收输入语音帧之后, 它比较输入语音帧的CNR0和前一语音帧的CNR0。
如果两个语音帧的CNR0不相等,在步骤302,VAD116将 ib_r0_avg设定为等于当前CNR0:
(1)ib_r0_avg(n)=CNR0(n)
并将ib_vm_avg设定为发音模式的当前值。
(2)ib_vm_avg(n)=Vm(n)
然而,如果步骤300中两个语音帧的CNR0相等,需要进一步的 调查,因为该相等可能是由于延迟的响应。
因此,在步骤304,VAD116确定当前Vm是否小于ib_vm_avg。 如果VAD116确定当前Vm小于ib_vm_avg,VAD116在步骤306中 用平滑因数“alpha”修正ib_vm_avg。更具体的,VAD116采用以下 公式:
(3)ib_vm_avg(n)=ib_vm_alphax Vm(n)+(1-
ib_vm_alpha)xib_vm_avg(n-1)
如果在步骤304,VAD116确定Vm不小于ib_vm_avg,VAD在 步骤308将ib_vm_avg设为等于当前Vm:
(4)ib_vm_avg(n)=Vm(n)
在步骤306和308之后,VAD116在步骤310确定ib_vm_avg是 否大于阈值ib_vm_thresh。如果平滑后的发音模式ib_vm_avg大于阈 值ib_vm_thresh,无需调整。然而如果ib_vm_avg不大于ib_vm_thresh, 则必须更新背景噪声估计。如果平滑后的发音模式小于阈值,则对该 语音帧的能量进行低通滤波并将其用于估计背景噪声电平。这是基于 噪声具有低发音模式的假设。在噪声电平突然增高的情况中,发音模 式保持为低,因此更新阈值。阈值的更新防止将噪声能量检测为话音。 因此,在步骤312,VAD116更新ib_r0_avg:
(5)ib_r0_avg(n)=(1-ib_r0_avg_alpha)x ib_r0_avg(n-1)+ ib_r0_avg_alphaxr0
为准确检测输入话音,将平滑后的输入能量和动态调整阈值比 较。该阈值是所述输入背景噪声的函数。背景噪声越大,该阈值就应 该越大,以避免检测失败。因此,本技术动态调整阈值,从而不会错 误检测输入VAD,甚至在极端噪声环境下。此种改编是基于语音帧的 发音模式以及该帧的能量的。
如以上图4所示,只要由实线代表的噪声曲线在阈值之下,不会 将噪声检测为话音,因此不会锁定信道。当噪声电平突然增加时,阈 值紧随噪声电平以防止其插入。用较长短划线表示原来的阈值。用较 短短划线表示新的阈值。如图所示,反映新的调整后的阈值的较短短 划线,随用实线表示的噪声电平更加快速调整。
使用发音模式估计背景噪声在多种实例中防止了错误检测话音。 在实施上述技术之前,当CNR0增加时,装置必须经历8-10秒的延迟。 而实施上述技术之后,相同装置内的延迟会降低到大约1/2秒。
虽然显示和说明了本发明的优选实施例,很清楚本发明不限于 此。本领域技术人员会作出多种修改、改变、变化、替换以及等同物, 而不背离由附随权利要求定义的本发明的精神和范围。
相关专利内容
标题 发布/更新时间 阅读量
阈值电压分析 2020-05-11 943
阈值选择方法及设备 2020-05-13 747
一种可编程阈值电路 2020-05-13 12
阈值确定装置和阈值确定方法 2020-05-12 883
读阈值设置方法与装置 2020-05-13 1046
阈值检测设备 2020-05-11 184
表示LSP切换阈值的LDP切换阈值TLV 2020-05-12 402
振幅阈值检测器 2020-05-11 532
阈值的测试和确定 2020-05-12 207
轮胎阈值阀 2020-05-11 822
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈