首页 / 专利库 / 信号处理 / 时间数字转换器 / 用于估计到达方向的方法和装置及电子设备

用于估计到达方向的方法和装置及电子设备

阅读:979发布:2020-05-11

专利汇可以提供用于估计到达方向的方法和装置及电子设备专利检索,专利查询,专利分析的服务。并且本 发明 公开了用于估计到达方向的方法和装置以及 电子 设备。所述方法包括:将在特定时间 帧 内的来自麦克 风 阵列中的一对麦克风的输入音频 信号 数字化;缓冲 数字化信号 ;从每个缓冲信号中提取多个子带,该子带 覆盖 预设带宽;计算所述一对麦克风的每个子带的 相位 偏移;根据各子带的相位偏移和 频率 执行线性回归,以估计与所述一对麦克风对应的子带的相位偏移和频率之间的估计关系系数;且通过所述一对麦克风的估计关系系数计算到达方向。,下面是用于估计到达方向的方法和装置及电子设备专利的具体信息内容。

1.一种用于估计到达方向的方法,包括:
将在特定时间内的来自麦克阵列中的一对麦克风的输入音频信号数字化;
缓冲数字化信号
从每个缓冲信号中提取多个子带,该子带覆盖预设带宽;
计算所述一对麦克风的每个子带的相位偏移;
根据各子带的相位偏移和频率执行线性回归,以估计与所述一对麦克风对应的子带的相位偏移和频率之间的估计关系系数;且
通过所述一对麦克风的估计关系系数计算到达方向;
其中,所述预设带宽选择成使得所述一对麦克风的两个麦克风之间的距离小于所述多个子带中的最高频率的波长的一半。
2.根据权利要求1所述的方法,其中,执行线性回归还包括:
根据子带的相位偏移和频率,基于最小均方LMS或归一化最小均方NLMS执行线性回归,以估计所述估计关系系数。
3.根据权利要求1或2所述的方法,其中,执行线性回归还包括:
基于以下关系执行线性回归以估计所述估计关系系数:
其中,N个子带中的每个的相位偏移是Δφi,i=1…N,N个子带中的每个的频率是ωi,i=1…N,且估计关系系数是
4.根据权利要求1或2所述的方法,其中,计算到达方向还包括:
基于空气中声音的速度、所述一对麦克风的所述两个麦克风之间的距离和估计关系系数计算到达方向。
5.根据权利要求4所述的方法,其中,到达方向是估计到达度 估计到达角度是入射方向和所述一对麦克风的平面的法线方向之间的角度,
其中,计算到达方向还包括:
基于以下关系计算到达方向:
其中
其中,C是空气中声音的速度,d是所述一对麦克风的所述两个麦克风之间的距离,且是估计关系系数。
6.根据权利要求5所述的方法,其中,麦克风阵列包括至少两对麦克风且所述至少两对麦克风的估计到达角度是
其中, 被放入直方图以获取优化的估计到达角度。
7.根据权利要求1所述的方法,其中,所述一对麦克风包括在麦克风阵列中的两个邻近麦克风。
8.根据权利要求1所述的方法,其中,预设带宽是输入音频信号的有效带宽的相对高的部分且有效带宽在150Hz至7000Hz的范围中。
9.一种用于估计到达方向的装置,包括:
A/D转换器,将在特定时间帧内的来自麦克风阵列中的一对麦克风的输入音频信号转换成数字化信号;
缓冲器,缓冲数字化信号;以及
处理装置,执行以下过程:
从每个缓冲信号中提取多个子带,该子带覆盖预设带宽;
计算所述一对麦克风的每个子带的相位偏移;
根据各子带的相位偏移和频率执行线性回归,以估计与所述一对麦克风对应的子带的相位偏移和频率之间的估计关系系数;且
通过所述一对麦克风的估计关系系数计算到达方向;
其中,所述预设带宽选择成使得所述一对麦克风的两个麦克风之间的距离小于所述多个子带中的最高频率的波长的一半。
10.根据权利要求9所述的装置,其中,处理装置还执行以下过程:
根据子带的相位偏移和频率,基于最小均方LMS或归一化最小均方NLMS执行线性回归,以估计所述估计关系系数。
11.根据权利要求9或10所述的装置,其中,处理装置还执行以下过程:
基于以下关系执行线性回归以估计所述估计关系系数:
其中,N个子带中的每个的相位偏移是Δφi,i=1…N,N个子带中的每个的频率是ωi,i=1…N,且估计关系系数是
12.根据权利要求9或10所述的装置,其中,处理装置还执行以下过程:
基于空气中声音的速度、所述一对麦克风的所述两个麦克风之间的距离和估计关系系数计算到达方向。
13.根据权利要求9或10所述的装置,其中,到达方向是估计到达角度 估计到达角度是入射方向和所述一对麦克风的平面的法线方向之间的角度,且处理装置还执行以下过程:
基于以下关系计算到达方向:
其中
其中,C是空气中声音的速度,d是所述一对麦克风的所述两个麦克风之间的距离,且是估计关系系数。
14.根据权利要求13所述的装置,还包括直方图单元,
其中,麦克风阵列包括至少两对麦克风,且处理装置分别生成所述至少两对麦克风的估计到达角度
其中,直方图单元接收 且将每个估计到达角度放入直方图以获取优化的估计到达角度。
15.根据权利要求9所述的装置,其中,所述一对麦克风包括在麦克风阵列中的两个邻近麦克风。
16.根据权利要求9所述的装置,其中,预设带宽是输入音频信号的有效带宽的相对高的部分,且有效带宽在150Hz至7000Hz的范围中。
17.一种电子设备,包括权利要求9-16任一所述的用于估计到达方向的装置。

说明书全文

用于估计到达方向的方法和装置及电子设备

技术领域

[0001] 本发明涉及麦克的技术领域,且更特别地涉及用于估计到达方向的方法、用于估计到达方向的装置及电子设备。

背景技术

[0002] 到达方向的估计在麦克风技术中广泛使用。例如,到达方向的估计可以用于上行噪音消除。
[0003] 估计到达方向的目的在于确定单个音频点源相对于麦克风阵列定位在哪个度方向。概括而言,到达方向由到达角度代表,到达角度是入射方向和麦克风平面的法线方向之间的角度。
[0004] 在现有技术中,借助于波束成形和统计分析执行这个任务。
[0005] 在这个现有技术中,计算量相对高且效率相对低。

发明内容

[0006] 实施方式的一个目的是提供用于估计到达方向的新的技术解决方案。
[0007] 根据第一方面,提供一种用于估计到达方向的方法,包括:将在特定时间内的来自麦克风阵列中的一对麦克风的输入音频信号数字化;缓冲数字化信号;从每个缓冲信号中提取多个子带,该子带覆盖预设带宽;计算所述一对麦克风的每个子带的相位偏移;根据各子带的相位偏移和频率执行线性回归,以估计与所述一对麦克风对应的子带的相位偏移和频率之间的的估计关系系数;且通过所述一对麦克风的估计关系系数计算到达方向。
[0008] 根据第二方面,提供一种用于估计到达方向的装置,包括:A/D转换器,将在特定时间帧内的来自麦克风阵列中的一对麦克风的输入音频信号转换成数字化信号;缓冲器,缓冲数字化信号;和处理装置,其执行以下过程:从每个缓冲信号中提取多个子带,该子带覆盖预设带宽;计算所述一对麦克风的每个子带的相位偏移;根据各子带的相位偏移和频率执行线性回归,以估计与所述一对麦克风对应的子带的相位偏移和频率之间的估计关系系数;且通过所述一对麦克风的估计关系系数计算到达方向。
[0009] 根据第三方面,提供一种电子设备,包括根据一种实施方式的用于估计到达方向的装置。
[0010] 根据一实施方式,可以减少用于估计到达方向的计算资源。
[0011] 通过以下参考附图对根据本发明的示例性实施例的详细描述,本发明的其它特征及其优点将变得清楚。

附图说明

[0012] 被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
[0013] 图1是示出从声源到麦克风阵列的到达时间差的示意图。
[0014] 图2是示出频率分量和相位差之间的关系的示意图。
[0015] 图3是根据一实施方式的用于估计到达方向的方法的示意性流程图
[0016] 图4是示出频率分量和相位差之间的关系系数的示意图。
[0017] 图5是示出估计到达方向的示例性处理的示意图。
[0018] 图6是根据另一实施方式的用于估计到达方向的装置的示意性框图
[0019] 图7是可以应用实施方式的解决方案的电子设备的示意图。

具体实施方式

[0020] 现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
[0021] 以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
[0022] 对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0023] 在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
[0024] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0025] 概括而言,对于位于足够远的单点声源而言(通常D>>d,例如典型地D比d长10倍),其中,D是声源和麦克风阵列之间的距离,且d是麦克风阵列的麦克风之间的元件间距离,入射到麦克风阵列的波被认为是平行的。入射信号的频率组成假设为宽频带(从覆盖宽频谱范围的数个频率的叠加的意义上来说)。在此,麦克风阵列可以是线性麦克风阵列。
[0026] 麦克风阵列的两个麦克风之间的到达时间差与入射信号的每个频率分量的相位偏移直接相关。这在图1中示出。如图1所示,声源S发出入射到麦克风阵列的声波。麦克风阵列包括麦克风mic1、mic2、...、micN。来自麦克风的输入声音信号在时间t的频率分量ω的相位分别是 i=1...N。在时间t的到达角度是θ(t)。D是声源S和麦克风阵列之间的距离,且d是麦克风阵列的两个连续麦克风之间的距离。
[0027] 两个连续麦克风之间的到达时间差τ可以如下表示:
[0028]
[0029] 其中,θ是到达角度,且C是声音在空气中的速度。在此,因为D>>d,入射波被认为是平行的。
[0030] 对于源信号的每个频率分量,到达时间差τ可以表示为相位偏移差。设是从第k个麦克风输入的声音信号的在时间t的频率分量ω的相位,且是从第k+1个麦克风输入的声音信号的在时间t的频率分量ω的相位。一阶
相位差继而可以表示为:
[0031]
[0032] 该表达式用到达时间差则可重新写为:
[0033]
[0034] 对于给定的到达角度θ,存在频率分量ω和一阶相位差 之间的正比关系:
[0035]
[0036] 这个关系可以表示为:
[0037] 其中
[0038] 这个正比关系在图2中示出。如图2所示,斜率α(θ)与θ成比例。所以θ可以从这个关系导出。
[0039] 图3是根据一实施方式的用于估计声源和麦克风阵列之间的到达方向的方法的示意性流程图。
[0040] 步骤S1100,将在特定时间帧内的来自麦克风阵列中的一对麦克风的输入音频信号数字化;
[0041] 步骤S1200,缓冲数字化信号;
[0042] 步骤S1300,从每个缓冲信号中提取多个子带,该子带覆盖预设带宽;
[0043] 步骤S1400,计算所述一对麦克风的每个子带的相位偏移;
[0044] 步骤S1500,根据各子带的相位偏移和频率执行线性回归,以估计与所述一对麦克风对应的子带的相位偏移和频率之间的估计关系系数;
[0045] 步骤S1600,通过麦克风阵列中的所述一对麦克风的估计关系系数计算到达方向。
[0046] 如上,这个实施方式中的解决方案提供用于计算到达角度的新的解决方案。在这个解决方案中,将麦克风阵列中的一对麦克风的信号分成多个子带。从相应子带获取的被线性拟合,以获取拟合关系系数。对于麦克风的到达角度可以直接从单一次反正弦变换导出,不用对每个子带执行反正弦变换且不用将从它们获取的角度的平均数当做最佳到达角度。这种方法在计算上相对简单且涉及相对少量的数据处理。这种方法的效率是相对高的。
[0047] 在下文中,将更加详细地描述方法步骤。如图3所示,在步骤S1100处,在特定时间帧内的来自麦克风阵列中的一对麦克风的输入音频信号被数字化。例如,所述一对麦克风的所述两个麦克风是连续的。概括而言,特定时间帧可以在10~20ms的范围内。
[0048] 在步骤S1200处,缓冲数字化信号。
[0049] 在步骤S1300处,从每个缓冲信号提取多个子带,该子带覆盖预设带宽。
[0050] 通常,滤波组件(filter bank)可以用于提取N个子带。滤波组件是众所周知的基于重叠相加FFT的方法,例如具有40%、50%或60%重叠。滤波组件是将输入信号分成多个分量的带通滤波器的阵列,每个分量携载原始信号的单一频率子带。
[0051] 例如,N是2的幂。N可以被选为覆盖10-20毫秒时间帧的2的最接近幂的值(例如2,4,8,16,32...)。在此,如果N是2的幂,则FFT算法将是更有效的。
[0052] 例如,可以导出相位 其中,k∈[0,M-1],M是麦克风阵列中的麦克风的数量,ω∈[ω0,ωN-1]覆盖预设带宽,且N是子带的数量。本领域技术人员将理解的是,子带足够窄,以至于频率ω在实践中可以分别用于代表子带。
[0053] 预设带宽的选择可以依据解决方案的应用和麦克风阵列拓扑,诸如麦克风的数量、元件间距离等等。
[0054] 在一个实施方式中,解决方案的应用是语音。通常,为了高清晰度,语音被包含在从150Hz至7000Hz的带宽中。大多数语音能量处于这个带宽的低频部分。然而,低频比高频方向性更弱。换言之,相比于高频,更难于找到低频来自哪个方向。
[0055] 在另一方面,传播到邻近麦克风的平面波在麦克风信道中生成延迟。这些延迟转化成感兴趣的信号的各个频率的相位偏移。
[0056] 因此,两个麦克风之间的距离决定相位偏移可以被测量的最低频率。距离越近,相位偏移越小。
[0057] 另一方面,近距离有助于检测高频。在此,为了避免“时间混叠”现象,选择预设带宽,以使得所述一对麦克风的所述两个麦克风之间的距离d小于N个子带中的最高频率的波长的一半,即,d<0.5*测量的最高频率的波长。
[0058] 总结而言,麦克风越近,可以越好地检测到高频且可以越少地检测到低频。所述两个麦克风之间的距离继而是感兴趣信号包含的最低频率和最高频率之间的权衡。
[0059] 此外,为了测量引入到达方向的相位偏移,考虑采样率。采样率越高,可以越准确地测量到小的相位偏移,尤其是当相位偏移对应于单个采样的一部分时,即,相位偏移<1个采样时间Ts=1/Fs,其中,Fs是采样率。
[0060] 在这方面,预设带宽的选择应该是麦克风距离和采样率之间的权衡。
[0061] 所以,在一示例中,预设带宽是输入音频信号的有效带宽相对高的部分。在此,输入音频信号的有效带宽包含有效信号能量,且相对高的部分用于使得到达方向的检测更准确。在此,有效带宽在从150Hz至7000Hz的范围内。
[0062] 在步骤S1400处,计算所述一对麦克风的每个子带的相位偏移。
[0063] 在此,可以选择两个邻近麦克风(或连续的麦克风)以导出N个子带中的每个的例如, 其中ω∈[ω0,ωN-1]。这个相位偏移也可以称为一阶相位差。如图4所示,N个子带的相位偏移在 和ω的平面(坐标系)中产生散点。概括而言,认为 和ω是线性关系。 轴和ω轴之间的回归线是相位偏移的理想分布,且导出的 在回归线附近。
[0064] 在步骤S1500处,根据各子带的相位偏移和频率执行线性回归,以估计与所述一对麦克风对应的子带的相位偏移和频率之间的估计关系系数。
[0065] 例如,根据子带的相位偏移和频率基于最小均方LMS或归一化最小均方NLMS执行线性回归,以估计所述估计关系系数。
[0066] 在一示例中,基于以下关系执行线性回归以估计所述估计关系系数:
[0067]
[0068] 其中,N个子带中的每个的相位偏移是 i=1...N,N个子带中的每个的频率是ωi,i=1...N,且估计的关系系数是
[0069] 如图4所示,现实声学环境中的背景噪声、电子噪声和/或混响的天然存在使得那些相位偏移点扩散在 和ω的平面中的理论比例性关系线的外侧。为了克服这个问题,在此使用基于LMS或NLMS调控的线性回归算法来估计关系系数 从而使得所述估计值能最小化散点沿回归线(在图4中由点围绕的线)的变化。如图4所示,可以获取频率分量和相位偏移之间的估计关系系数 估计关系系数 可以被认为是回归线的斜率。
[0070] 在步骤S1600处,通过所述一对麦克风的估计关系系数计算到达方向。
[0071] 例如,基于空气中声音的速度、所述一对麦克风的所述两个麦克风之间的距离和估计的关系系数计算到达方向。
[0072] 在一示例中,到达方向是估计到达角度 估计到达角度是入射方向和所述一对麦克风的平面的法线方向之间的角度。
[0073] 可以通过以下关系计算到达方向:
[0074] 其中
[0075] 其中,C是空气中声音的速度,d是所述一对麦克风的所述两个麦克风之间的距离,且 是估计关系系数。的符号将确定 是否是正角度或负角度。
[0076] 本领域技术人员将理解的是,由于估计关系系数包含固有角度信息,基于关系系数,除到达角度之外的许多其他方式可以用于代表到达方向。
[0077] 在所述实施方式中,使用线性回归来充分利用相位偏移和频率之间的线性关系。在此,比例系数 首先被估计和优化,而后仅进行单次反正弦变换以获取估计到达角度如上文说明的那样,与现有技术相比,这个实施方式在计算方面是更优化的,而且就弥散噪声而言鲁棒性更好。
[0078] 可选地,麦克风阵列包括至少两对麦克风。所述至少两对麦克风的到达角度可以如上估计且为 j=1、2...。估计到达角度 被放入直方图以获取优化的估计到达角度。直方图可以用于统计分析,以确保角度区域的解决方案是由应用和麦克风阵列特征所决定的。在此,从麦克风对获取的估计到达角度被统计处理,以选择最可能(如数量最多)的到达角度或到达角度范围,作为相对于麦克风阵列的到达方向。
[0079] 图5是示出估计到达方向的示例性处理的示意图。在图5中,麦克风阵列包括三个麦克风mic1、mic2和mic3。入射波由三个麦克风接收,而后作为输入信号传到处理单元A1、A2和A3,在处理单元中,入射波被数字化且缓冲。然后,在A1、A2和A3中从输入信号提取N个子带。然后,计算N个子带的相位 基于N个子带的相位,获取对于mic1和mic2的所述两个对应子带的相位偏移 和对于mic2和mic3的所述两个对应子带的相位偏移 在此,虽然获取连续麦克风的相位偏移,但是本领域技术人员将理解的是,也可以获取其他麦克风的相位偏移,例如第一麦克风mic1和第三麦克风mic3之间的相位偏移。
[0080] 通过利用N个子带的相位偏移 通过基于LMS或NLMS的线性回归获取估计关系系数 同样,也获取估计关系系数
[0081] 可以从系数 导出估计到达角度 i=1、2
[0082] 最后,估计到达角度 被放入直方图以获取优化的估计到达角度
[0083] 图6是根据另一实施方式的用于估计到达方向的装置的示意性框图。如图6所示,用于估计到达方向的装置20连接到麦克风阵列10且从麦克风阵列10接收输入音频信号。
[0084] 用于估计到达方向的装置20包括:A/D转换器21、缓冲器22、和处理装置23。
[0085] A/D转换器21接收在特定时间帧内的来自麦克风阵列中的一对麦克风的输入音频信号且将之转换成数字化信号。缓冲器22缓冲数字化信号。例如,所述一对麦克风包括麦克风阵列中的两个邻近麦克风。特定时间帧可以在10~20ms的范围内。
[0086] 处理装置23从每个缓冲信号中提取多个子带,该子带覆盖预设带宽。例如,预设带宽是输入音频信号的有效带宽的相对高的部分且有效带宽在从150Hz至7000Hz的范围内。例如,预设带宽选择成使得所述一对麦克风的所述两个麦克风之间的距离d小于N个子带中的最高频率的波长的一半。预设带宽可以是输入音频信号的有效带宽的相对高的部分。N可以2的幂。
[0087] 处理装置23计算所述一对麦克风的每个子带的相位偏移。
[0088] 处理装置23根据子带的相位偏移和频率执行线性回归,以估计与所述一对麦克风对应的子带的相位偏移和频率之间的估计关系系数。例如,根据子带的相位偏移和频率,基于最小均方LMS或归一化最小均方NLMS执行线性回归,以估计所述估计关系系数。
[0089] 在一示例中,基于以下关系执行线性回归以估计所述估计关系系数:
[0090]
[0091] 其中,N个子带中的每个的相位偏移是Δφi,i=1...N,N个子带中的每个的频率是ωi,i=1...N,且估计关系系数是
[0092] 处理装置23通过所述一对麦克风的估计关系系数计算到达方向。例如,处理装置23还执行以下过程:基于空气中声音的速度、所述一对麦克风的所述两个麦克风之间的距离和估计关系系数计算到达方向。
[0093] 例如,到达方向是估计到达角度 估计到达角度是入射方向和所述一对麦克风的平面的法线方向之间的角度,其中,处理装置23基于以下关系计算到达方向:
[0094] 其中
[0095] 其中,C是空气中声音的速度,d是所述一对麦克风的所述两个麦克风之间的距离,且 是估计关系系数。
[0096] 可选地,麦克风阵列包括至少两对麦克风。在这种情况下,处理装置23分别生成所述至少两对麦克风的估计到达角度 j=1、2...。用于估计到达方向的装置20还包括直方图单元,直方图单元接收 j=1、2...,且将之放入直方图以获取优化的估计到达角度。
[0097] 组件21-23可以由软件硬件或其组合一起或单独实施。例如,所述构件可以通过诸如CPU或MPU的计算单元和存储用于控制计算单元的指令的存储器的组合实施,以在所述构件运行期间实施相应功能。替换性地,所述构件可以实施成可编程逻辑电路、现场可编程阵列(FPGA)、可编程逻辑阵列(PLA)、或专用集成电路(ASIC)。在本公开的教导下,所有这些实施方案都能实行。本领域技术人员将理解的是,除了一些像扬声器、麦克风等的机械部件之外,软件等价于硬件。在这方面,本领域技术人员可以设想到,在本公开的教导之下,硬件形式、软件形式和/或其组合的实施方案是等价的。在这方面,本公开将不限制组件21-23的实施形式。本领域技术人员可以在本公开的教导下考虑到成本、市场供应状况等选择实施形式。
[0098] 图7是实施方式的解决方案可以应用的电子设备的示意图。
[0099] 在图7中,电子设备30包括如上用于估计到达方向的装置。在图7中示出机30,且所述耳机包括控制盒31。用于估计到达方向的装置可以放在控制盒31中。本领域技术人员将理解的是,电子设备可以是任何类型的电子设备,诸如耳塞式耳机、头戴式耳机、智能电话、平板电脑笔记本电脑等。
[0100] 虽然已经通过示例详细阐述本发明的一些特定实施例,但是本领域技术人员将理解到上述示例仅旨在是示意性的而非限制本发明的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈