首页 / 专利库 / 数学与统计 / 快速傅立叶变换 / 用于多声道音频的室内特征化和校正

用于多声道音频的室内特征化和校正

阅读:574发布:2022-11-23

专利汇可以提供用于多声道音频的室内特征化和校正专利检索,专利查询,专利分析的服务。并且装置和方法适用于对多声道扬声器配置进行特征化,从而校正扬声器室内延迟、增益和 频率 响应,或对子频带域校正 滤波器 进行配置。在用于对多声道扬声器配置进行特征化的 实施例 中,将宽带探测 信号 供给到前置 放大器 的每个音频输出,所述音频输出中的多个被耦合到收听环境中处于多声道配置中的扬声器。扬声器将探测信号转换为声学响应,声学响应在通过静默时段间隔开的非重叠时隙中作为 声波 被发送到收听环境之中。对于被探测的每个音频输出,声波被将声学响应转换为宽带电响应信号的多麦克 风 阵列接收。,下面是用于多声道音频的室内特征化和校正专利的具体信息内容。

1.一种用于对多声道扬声器配置进行特征化的方法,包括:
产生第一探测信号
将第一探测信号供给到多个音频输出,所述多个音频输出被耦合到收听环境中以多声道配置定位的相应的声换能器,以便将第一探测信号转换为第一声学响应,并依次将声学响应在通过静默时段间隔开的非重叠时隙中作为声波发送到收听环境中;以及对于每个所述音频输出,
在包括至少两个非重合声电换能器的多麦克阵列处接收声波,所述声电换能器的每个将声学响应转换成第一电响应信号;
用第一探测信号对第一电响应信号进行解卷积以便确定所述电声换能器的在每个所述声电换能器处的第一室内响应;
计算所述电声换能器的在每个所述声电换能器处的延迟并将所述延迟记录在存储器中;以及
针对偏移了所述电声换能器的在每个所述声电换能器处的延迟的指定时段,在存储器中记录第一室内响应;
基于到每个所述声电换能器的延迟,确定到每个所述电声换能器的距离以及至少第一度;以及
使用到所述电声换能器的距离以及至少所述第一角度,自动选择特定的多声道配置并计算收听环境内在那个多声道配置中每个电声换能器的位置
2.根据权利要求1的方法,其中,计算延迟的步骤包括:
处理每个所述第一电响应信号以及第一探测信号以产生时间序列;
将在所述时间序列中存在或不存在显著峰值检测为指示出音频输出是否被耦合到电声换能器;以及
将峰值的位置计算为延迟。
3.根据权利要求1的方法,其中,在第一电响应在声电换能器处被接收时,第一电响应信号被分割为并被用第一探测信号的分割进行解卷积,且其中,在发送下一探测信号之前的静默时段中,延迟和第一室内响应被计算并记录到存储器。
4.根据权利要求3的方法,其中,用第一探测信号的分割对分割后的第一响应信号进行解卷积的步骤包括:
预先计算并存储非负频率的长度为K*N/2的时间反演第一探测信号的K个分割后的N点快速傅立叶变换(FFT)的集合,作为探测矩阵;
计算第一电响应信号的N/2个样本的连续重叠块的N点FFT并将非负频率的N/2+1个FFT系数存储为分割;
累积K个FFT分割作为响应矩阵;
执行响应矩阵与探测矩阵的快速卷积以提供当前块的N/2+1个点的频率响应;
通过到负频率的共轭对称扩展计算频率响应的N点逆FFT以形成当前块的第一候选室内响应;以及
附加连续块的第一候选室内响应以形成第一室内响应。
5.根据权利要求4的方法,其中,估算延迟的步骤包括:
在负频率值被设置为零的情况下计算频率响应的N点逆FFT以产生希尔伯特包络(HE);
在连续块上跟踪HE的最大值以便更新对延迟的计算。
6.根据权利要求5的方法,进一步包括:
在第一探测信号之后,将第二预加重探测信号供给到所述多个音频输出中的每个音频输出以记录第二电响应信号;
用第一探测信号的分割对第二响应信号的重叠块进行解卷积以产生第二候选室内响应的序列;以及
使用第一探测信号的延迟来附加连续的第二候选室内响应以形成第二室内响应。
7.根据权利要求1的方法,其中,
如果所述多麦克风阵列仅仅包括两个声电换能器,则计算到位于半平面上的电声换能器的至少所述第一角度;
如果所述多麦克风阵列仅仅包括三个声电换能器,则计算到位于平面上的电声换能器的至少所述第一角度;以及
如果所述多麦克风阵列包括四个或多于四个声电换能器,则计算到以三维方式定位的电声换能器的作为仰角以及方位角的至少所述第一角度。
8.一种用于对回放多声道音频的收听环境进行特征化的方法,包括:
产生第一探测信号;
将第一探测信号供给到收听环境中的以多声道配置定位的多个电声换能器中的每个电声换能器,以便将第一探测信号转换为第一声学响应,并依次将声学响应在非重叠时隙中作为声波发送到收听环境中;以及
对于每个所述电声换能器,
在包括至少两个非重合声电换能器的多麦克风阵列处接收声波,所述声电换能器的每个将声学响应转换成第一电响应信号;
用第一探测信号对第一电响应信号进行解卷积以确定每个电声换能器的室内响应;
对于高于截止频率的频率,根据室内响应计算作为声压的函数的室内能量量度的第一部分;
对于低于截止频率的频率,根据室内响应计算作为声压和声速的函数的室内能量量度的第二部分;
混合能量量度的第一部分和第二部分以提供在指定声学频带上的室内能量量度;以及根据室内能量量度计算滤波器系数。
9.根据权利要求8的方法,其中,处理器根据室内能量量度来计算滤波器系数。
10.根据权利要求9的方法,进一步包括以下步骤:
使用滤波器系数来配置处理器中的数字校正滤波器。
11.根据权利要求10的方法,进一步包括以下步骤:
接收多声道音频信号
用处理器对多声道音频信号进行解码以形成用于每个所述电声换能器的音频信号;
使每个所述音频信号通过对应的数字校正滤波器以形成校正后的音频信号;以及将每个所述校正后的音频信号供给到对应的电声换能器,以便将校正后的音频信号转换成声学响应并将声学响应作为声波发送到收听环境中。
12.根据权利要求8的方法,进一步包括:
对室内响应或室内能量量度逐渐地进行平滑以使得较大的平滑被应用于较高的频率。
13.根据权利要求12的方法,其中,对室内响应逐渐地进行平滑的步骤包括对室内响应应用时变滤波器,在所述时变滤波器中,滤波器的低通响应的带宽随时间逐渐地变小。
14.根据权利要求12的方法,其中,对室内能量量度逐渐地进行平滑的步骤包括用可变遗忘因子来应用前向及后向频域平均。
15.根据权利要求8的方法,其中,能量量度的第二部分通过以下步骤来计算:
根据室内响应来计算作为声压的函数的第一能量分量;
根据所述室内响应来计算压梯度;
对压力梯度应用依赖于频率的加权以计算声速分量;
根据声速分量来计算第二能量分量;以及
计算作为第一能量分量和第二能量分量的函数的能量量度的第二部分。
16.根据权利要求15的方法,其中,计算压力梯度的步骤以及对压力梯度应用依赖于频率的加权以计算声速分量的步骤直接根据室内响应一体化地执行。
17.根据权利要求15的方法,其中,计算第一能量分量包括:
对至少两个所述声电换能器的室内响应取平均以计算平均频率响应;以及根据平均频率响应来计算第一能量分量。
18.根据权利要求8的方法,其中,所述第一探测信号是以在指定声学频带上基本上恒定的幅度谱为特征的宽带序列,所述方法进一步包括:
产生第二探测信号,所述第二探测信号是预加重序列,所述预加重序列以如下预加重函数为特征:所述预加重函数具有与应用到基带序列的频率成反比的幅度谱,所述预加重函数提供在指定声学频带的低频率部分上的放大的幅度谱;
将第二探测信号供给到每个电声换能器,以便将第二探测信号转换为第二声学响应并在非重叠时隙中将第二声学响应作为声波发送到收听环境中;
对于每个所述电声换能器,
用所述至少两个非重合声电换能器在多麦克风阵列处接收所述第一探测信号和第二探测信号的声波,所述声电换能器的每个将声学响应转换成作为声压的量度的第一电响应信号和第二电响应信号;
分别用第一探测信号和基带序列对第一电响应信号以及第二电响应信号进行解卷积,以确定每个电声换能器的第一室内响应以及第二室内响应;
对于高于截止频率的频率,根据第一室内响应计算作为声压的函数的室内能量量度的第一部分;
对于低于截止频率的频率,根据第二室内响应计算作为声压和声速的函数的室内能量量度的第二部分;
混合能量量度的第一部分和第二部分以提供指定声学频带上的室内能量量度;以及根据室内能量量度来计算滤波器系数。
19.根据权利要求18的方法,其中,宽带序列是基带序列,所述预加重函数被应用于基带序列以产生预加重序列。
20.根据权利要求19的方法,其中,宽带序列包括:以在指定声学频带上基本上恒定的幅度谱以及具有比任意非零滞后值高至少30dB的零滞后值的自相关序列为特征的全通序列。
21.根据权利要求20的方法,其中,通过以下步骤形成全通序列:
产生-π与+π之间的随机数序列;
应用重叠的高通滤波器低通滤波器以便对随机数序列进行平滑;
产生平滑后的随机数序列的具有单一幅度和相位的频域中的全通探测信号;
对全通探测信号执行逆FFT以形成全通序列,且其中,预加重序列通过以下步骤形成:
对频域中的全通探测信号应用预加重函数以便形成频域中的预加重探测信号;以及对预加重探测信号执行逆FFT以形成预加重序列。
22.根据权利要求18的方法,其中,通过以下步骤来计算能量量度的第二部分:
根据第二室内响应来计算作为声压的函数的第一能量分量;
根据所述第二室内响应来计算压力梯度;
根据压力梯度来计算声速分量;
根据声速分量来计算第二能量分量;以及
计算作为第一能量分量和第二能量分量的函数的能量量度的第二部分。
23.根据权利要求22的方法,其中,通过以下步骤来计算第一能量分量:
根据至少两个所述声电换能器的第二室内响应来计算平均预加重频率响应;
对预加重平均频率响应应用去加重缩放;以及
根据平均预加重频率响应来计算第一能量分量。
24.根据权利要求22的方法,其中,计算压力梯度的步骤以及对压力梯度应用依赖于频率的加权以计算声速分量的步骤直接根据室内响应一体化地执行。
25.根据权利要求22的方法,其中,能量量度的第二部分是第一能量分量和第二能量分量的和。
26.根据权利要求8的方法,其中,用于每个声道的滤波器系数是通过比较室内能量量度与声道目标曲线来计算的,所述方法进一步包括对室内能量量度应用频率平滑以定义声道目标曲线。
27.根据权利要求26的方法,进一步包括:
对声道目标曲线取平均以形成共同目标曲线;以及
对每个校正滤波器应用校正以补偿声道目标曲线与共同目标曲线之间的差异。
28.一种产生用于多声道音频系统的校正滤波器的方法,包括:
提供对于P个子频带将音频信号下采样到基带的P频带过采样分析滤波器组以及对P个子频带进行上采样以重建音频信号的P频带过采样合成滤波器组,其中,P是整数;
提供每个声道的频谱量度;
将每个所述频谱量度与声道目标曲线合并以提供每一声道的聚集频谱量度;
对于至少一个声道,
提取对应于不同子频带的聚集频谱量度的部分;
将频谱量度的所提取部分重新映射至基带以模拟分析滤波器组的下采样
估算到每个子频带的重新映射后的频谱量度的自动回归(AR)模型;以及将每个所述AR模型的系数映射到最小相位全零子频带校正滤波器的系数;以及根据对应参数配置P个数字全零子频带校正滤波器,所述P个数字全零子频带校正滤波器对在分析滤波器组与合成滤波器组之间的P个基带音频信号进行频率校正。
29.根据权利要求28的方法,其中,频谱量度包括室内频谱量度。
30.根据权利要求28的方法,其中,P个子频带具有均匀的带宽并且是重叠的。
31.根据权利要求28的方法,其中,频谱量度在较高频率处具有逐渐减小的分辨率
32.根据权利要求28的方法,其中,通过以下步骤来计算AR模型:
计算作为重新映射后的频谱量度的逆FFT的自相关序列;以及
对自相关序列应用莱文逊-德宾算法以计算AR模型。
33.根据权利要求32的方法,其中,莱文逊-德宾算法产生子频带的剩余功率估算值,所述方法进一步包括:
基于子频带的剩余功率估算值来选择校正滤波器的阶数。
34.根据权利要求28的方法,其中,声道目标曲线是用户选择的目标曲线。
35.根据权利要求28的方法,进一步包括对声道室内频谱响应应用频率平滑以定义声道目标曲线。
36.根据权利要求28的方法,进一步包括:
提供所有所述声道的共同目标曲线;以及
对每个校正滤波器应用校正以补偿声道目标曲线与共同目标曲线之间的差异。
37.根据权利要求33的方法,进一步包括对声道目标曲线取平均以形成共同目标曲线。
38.一种用于处理多声道音频的装置,包括:
多个音频输出,用于驱动耦合到其的相应的电声换能器,所述电声换能器在收听环境中以多声道配置定位;
一个或多于一个音频输入,用于从耦合到其的多个声电换能器接收第一电响应信号;
耦合到所述一个或多于一个音频输入的输入接收器,用于接收多个第一电响应信号;
装置存储器,以及
一个或多于一个处理器,适用于实现以下模块,
探测产生和发送调度模块,适用于:
产生第一探测信号,以及
在通过静默时段间隔开的非重叠时隙中将第一探测信号供给到多个音频输出中的每个音频输出,
室内分析模块,适用于,
对于每个所述音频输出,用第一探测信号对第一电响应信号进行解卷积以确定在每个所述声电换能器处的第一室内响应,计算并在装置存储器中记录在每个所述声电换能器处的延迟,并且针对偏移了在每个所述声电换能器处的延迟的指定时段在装置存储器中记录第一室内响应,
基于每个所述电声换能器的在每个所述声电换能器处的延迟,确定到电声换能器的距离以及至少第一角度,以及
通过使用到电声换能器的距离以及至少第一角度,自动选择特定的多声道配置并计算收听环境内在那个多声道配置中每个电声换能器的位置。
39.根据权利要求38的装置,其中,室内分析模块适用于在第一电响应被接收时将第一电响应信号分隔为重叠的块并用第一探测信号的分割对每个块进行解卷积,以及在发送下一探测信号之前的静默时段中计算并记录延迟以及第一室内响应。
40.一种用于处理多声道音频的装置,包括:
多个音频输出,用于驱动耦合到其的相应的电声换能器;
一个或多于一个音频输入,用于从耦合到其的至少两个非重合声电换能器接收第一电响应信号;
耦合到所述一个或多于一个音频输入的输入接收器,用于接收多个第一电响应信号;
装置存储器,以及
一个或多于一个处理器,适用于实现以下模块,
探测产生和发送调度模块,适用于:
产生第一探测信号,以及
在通过静默时段间隔开的非重叠时隙中将第一探测信号供给到多个音频输出中的每个音频输出;
室内分析模块,适用于对于每个所述电声换能器:
用第一探测信号对第一电响应信号进行解卷积以便确定电声换能器的在每个声电换能器处的室内响应;
对于高于截止频率的频率,根据室内响应计算作为声压的函数的室内能量量度的第一部分;
对于低于截止频率的频率,根据室内响应计算作为声压和声速的函数的室内能量量度的第二部分;
混合能量量度的第一部分和第二部分以提供指定声学频带上的室内能量量度;以及根据室内能量量度来计算滤波器系数。
41.根据权利要求40的装置,其中,第一探测信号是以在指定声学频带上基本上恒定的幅度谱为特征的宽带序列,且其中,探测产生和发送调度模块适用于产生第二探测信号并将第二探测信号供给到每个电声换能器,所述第二探测信号是以如下预加重函数为特征的预加重序列,所述预加重函数具有与应用到基带序列的频率成反比的幅度谱并且提供在指定声学频带的低频率部分上的放大的幅度谱,且其中,分析模块适用于将第二探测信号的声学响应转换成第二电响应信号,并用基带序列对那些第二电响应信号进行解卷积以便确定电声换能器的在每个声电换能器处的第二室内响应,对于高于截止频率的频率,根据第一室内响应计算作为声压的函数的室内能量量度的第一部分,对于低于截止频率的频率,根据第二室内响应计算作为声压和声速的函数的室内能量量度的第二部分,以及,混合能量量度的第一部分和第二部分以提供指定声学频带上的室内能量量度。
42.根据权利要求41的装置,其中,分析模块适用于通过以下操作来计算能量量度的第二部分:
根据第二室内响应来计算作为声压的函数的第一能量分量;
根据第二室内响应来估算压力梯度;
根据压力梯度来估算声速分量;
根据声速分量来计算第二能量分量;以及
计算作为第一能量分量和第二能量分量的函数的能量量度的第二部分。
43.一种用于产生用于多声道音频系统的校正滤波器的装置,
一个或多于一个处理器,适用于对于至少一个音频声道实现以下模块,
回放模块,适用于提供对于P个子频带将音频信号下采样到基带的P频带过采样分析滤波器组、P个最小相位全零子频带校正滤波器以及对P个子频带进行上采样以重建音频信号的P频带过采样合成滤波器组,其中,P是整数,以及
分析模块,适用于将频谱量度与声道目标曲线合并以提供聚集频谱量度,提取并重新映射聚集频谱量度的对应于不同子频带的部分到基带以模拟分析滤波器组的下采样,计算到每个子频带的重新映射后的频谱量度的自动回归(AR)模型,并将每个所述AR模型的系数映射到回放模块中的对应的最小相位全零子频带校正滤波器的系数。
44.根据权利要求43的装置,其中,分析模块通过以下操作来计算AR模块:
计算作为重新映射后的频谱量度的逆FFT的自相关序列;以及
对自相关序列应用莱文逊-德宾算法以计算AR模型。
45.一种对收听环境进行特征化的方法,包括:
产生第一探测信号,所述第一探测信号是以在指定声学频带上基本上恒定的幅度谱以及具有比任意非零滞后值至少高30dB的零滞后值的自相关序列为特征的宽带序列;
产生第二探测信号,所述第二探测信号是以应用到基带序列的预加重函数为特征的预加重序列,所述预加重函数提供在与指定声学频带重叠的指定目标频带上的放大的幅度谱;
将第一探测信号和第二探测信号供给到多声道音频系统中的多个电声转换器中的每个电声转换器,以便将第一探测信号和第二探测信号转换成第一及第二声学响应,并且在非重叠时隙中依次将声学响应作为声波发送到收听环境中;以及
对于每个所述电声转换器,
在一个或多于一个声电换能器处接收声波以便将声学响应转换成第一电响应信号和第二电响应信号;
对第一电响应信号和第二电响应信号进行解卷积以确定第一室内响应和第二室内响应;
对于目标频带外的频率,根据第一室内响应计算第一频谱量度;
对于目标频带内的频率,根据第二响应计算第二频谱量度;
混合第一频谱量度和第二频谱量度以提供指定声学频带上的频谱量度。
46.根据权利要求45的方法,其中,第一探测信号的宽带序列提供第二探测信号的基带序列。

说明书全文

用于多声道音频的室内特征化和校正

技术领域

[0001] 本发明涉及多声道音频回放装置和方法,更具体地涉及适用于对多声道扬声器配置进行特征化(characterize)并对扬声器/室内延迟、增益和频率响应进行校正的装置和方法。

背景技术

[0002] 家庭娱乐系统已经从简单的立体声系统转移到多声道音频系统,例如环绕声系统和更近的3D声系统,以及具有视频显示的系统。尽管这些家庭娱乐系统已经得到改进,但室内音质仍存在缺陷,例如,由来自房间内的表面的反射和/或扬声器相对于收听者的非均匀放置所导致的声音失真。由于家庭娱乐系统广泛地在家中使用,所以室内音质的改进是使家庭娱乐系统用户更好地享受其喜欢的收听环境所关心的问题。
[0003] “环绕声”是音频工程中用来指这样的声音再现系统的术语:该系统使用多个声道和扬声器来为置身于扬声器之间的收听者提供声音源的模拟放置。通过一个或多于一个的扬声器,声音可以以不同延迟和不同强度再现,从而用声音源“环绕”收听者,并由此产生更加有趣或真实的收听体验。传统的环绕声系统包括扬声器的二维配置,例如前置、中央、后置以及可能的侧置。更新的3D声系统包括扬声器的三维配置。例如,该配置可包括高以及低的前置、中央、后置或侧置扬声器。如这里使用的,多声道扬声器配置包括立体声、环绕声和3D声系统。
[0004] 多声道环绕声在电影院和家庭影院应用中使用。在一种常见的配置中,家庭影院中的收听者被五个扬声器而不是传统家庭立体声系统中使用的两个扬声器环绕。在五个扬声器中,三个放置在房间的前方,其余两个环绕扬声器位于收听/观看位置的后方或侧方( Dipolar)。新配置使用“长条形音箱”,其包括能模拟环绕声体验的多个扬声器。在现今使用的多种环绕声格式中,Dolby 是七十年代早期为电影院开发的原始环绕格式。Dolby 在1996年初次亮相。Dolby 是具有六个离
散音频声道并克服了Dolby 的依赖于这样的矩阵系统的某些限制的数字格
式:该系统将四个音频声道组合为将存储在记录介质上的两个声道。Dolby 也
称为5.1声道格式,并在几年前广泛用于电影声记录。现今使用的另一格式是DTS Digital TM
Surround ,其提供比Dolby 更高的音频品质(每秒1,411,200对384,000位)以及许多不同的扬声器配置,例如5.1、6.1、7.1、11.2等及其变型,例如7.1前置增宽、前置增高、中央上方、侧置增高或中央增高。例如, 支持 盘上的七个不
同的7.1声道配置。
[0005] 音频/视频前置放大器(或A/V控制器或A/V接收器)处理将两声道Dolby Dolby 或DTS Digital SurroundTM或 信号
解码为相应的分立声道的工作。A/V前置放大器输出分别为左置、中央、右置、左环绕、右环绕以及重低音声道提供六个线路电平信号。这些分立的输出被馈送到多声道功率放大器,或者在具有集成接收器的情况下被内部放大,以便驱动家庭影院扬声器系统。
[0006] 可能需要对A/V前置放大器进行手动设置以及精细调谐,以获得最佳的性能。在根据用户手册连接家庭影院系统之后,用于扬声器设置的前置放大器或接收器必须被配置。例如,A/V前置放大器必须知道使用中的具体环绕声扬声器配置。在许多情况下,A/V前置放大器仅仅支持默认的输出配置,如果用户不能将5.1或7.1扬声器放置在那些位置的话,他或她就只能运气不好了。几种高端A/V前置放大器支持多种7.1配置,并让用户从菜单中选择合适的室内配置。另外,各个音频声道(声道的实际数量由使用的具体环绕声格式决定)的响度应当个别地设置,以提供来自扬声器的音量的整体平衡。这种过程通过依次从各个扬声器产生噪声形式的“测试信号”并在收听/观看位置处独立地调节各个扬声器的音量而开始。为此任务推荐的工具是声压平(SPL)计。这提供了对不同扬声器灵敏度、收听室内音质以及扬声器放置的补偿。其它因素可使得校准复杂得多,例如不对称的收听空间和/或成度的观看区域、窗户、拱廊以及倾斜的天花板。
[0007] 因此,可能希望提供这样的系统和方法:其通过调节各个音频声道的频率响应、振幅响应和时间响应,自动校准多声道声系统。另外,可能希望该方法能在环绕声系统正常运行期间进行而不打扰收听者。
[0008] 题为“Auto-Calibrating Surround System”的美国专利No.7,158,643介绍了一种方法,其允许对环绕声系统各个声道的频率、振幅和时间响应的自动且独立的校准和调节。该系统产生通过扬声器播放并由麦克记录的测试信号。系统处理器用测试信号对所接收的声信号进行校正,并根据校正后的信号确定白化响应。题为“Room Acoustics Correction Device”的美国专利公开No.2007,0121955介绍了类似的方法。

发明内容

[0009] 下面是为了提供对本发明某些方面的基本理解而对本发明的概述。此概述并非旨在指明本发明的关键或重要元素或是描述本发明的范围。其唯一的目的是作为对更为详细的说明以及后面给出的限定性权利要求的引言,以简化的形式给出本发明的某些概念。
[0010] 本发明提供了适用于对多声道扬声器配置进行特征化,从而对扬声器/室内延迟、增益和频率响应进行校正或对子频带域校正滤波器进行配置的装置和方法。
[0011] 在对多声道扬声器配置进行特征化的实施例中,将宽带探测信号供给到A/V前置放大器的每个音频输出,所述音频输出中的多个在收听环境中被耦合到多声道配置中的扬声器。扬声器将探测信号转换为声学响应,其在通过静默时段分隔开的非重叠时隙中作为声波被发送到收听环境中。对于被探测的每个音频输出,声波被多麦克风阵列接收,该阵列将声学响应转换为宽带电响应信号。在传送下一个探测信号之前的静默时段中,一个或多于一个处理器用宽带探测信号对宽带电响应信号进行解卷积以确定扬声器在每个麦克风处的宽带室内响应,计算并在存储器中记录扬声器在每个麦克风处的延迟,针对偏移了扬声器的延迟的指定时段在存储器中记录在每个麦克风处的宽带响应,并判断音频输出是否被耦合到扬声器。音频输出是否被耦合的判断可被推迟直到每个声道的室内响应被处理位置。一个或多于一个处理器可在宽带电响应信号被接收时对之进行分割,并使用例如分割的FFT对分割后的信号进行处理以形成宽带室内响应。一个或多于一个处理器可根据分割后的信号计算并持续更新希尔伯特包络(Hilbert Envelope,HE)。HE中的显著峰值可用于计算延迟并判断音频输出是否被耦合到扬声器。
[0012] 基于计算得到的延迟,一个或多于一个处理器对于每个连接的声道确定到扬声器的距离以及至少第一角度(例如方位角)。如果多扬声器阵列包括两个麦克风,则处理器可解算到位于半平面内的扬声器(或者到前方、任一侧方或者到后方)的角度。如果多麦克风阵列包括三个麦克风,则处理器可解算位于由三个麦克风限定的平面内的扬声器(到前方、侧方以及到后方)的角度。如果多麦克风阵列包括处于3D布置中的四个或多于四个麦克风,则处理器可解算到位于三维空间内的麦克风的方位角和仰角。通过使用到所耦合的麦克风的这些距离和角度,一个或多于一个处理器自动选择特定的多声道配置并计算收听环境内每个扬声器的位置。
[0013] 在用于对扬声器/室内频率响应进行校正的实施例中,宽带探测信号以及可能的预加重(pre-emphasize)探测信号被供给到A/V前置放大器的每个音频输出,所述音频输出中的至少多个被耦合到收听环境中处于多声道配置中的扬声器。扬声器将探测信号转换为声学响应,声学响应在通过静默时段分隔开的非重叠时隙中作为声波被发送到收听环境中。对于被探测的每个音频输出,声波被将声学响应转换为电响应信号的多麦克风阵列接收。一个或多于一个处理器用宽带探测信号对电响应信号进行解卷积以确定扬声器的在每个麦克风处的室内响应。
[0014] 一个或多于一个处理器根据室内响应计算室内能量量度。一个或多于一个处理器对于高于截止频率的频率计算作为声压(sound pressure)的函数的室内能量量度的第一部分,并对于低于截止频率的频率计算作为声压和声速(sound velocity)的函数的室内能量量度的第二部分。声速根据跨麦克风阵列的声压的梯度获得。如果使用既包括宽带探测信号又包括预加重探测信号的双探测信号,则从宽带室内响应提取仅基于声压的能量量度的高频率部分,并从预加重室内响应提取基于声压和声速二者的能量量度的低频率部分。双探测信号可用于在没有声速分量的情况下计算室内能量量度,在这种情况下,预加重探测信号用于噪声整形。一个或多于一个处理器将能量量度的第一及第二部分混合以提供特定声学频带上的室内能量量度。
[0015] 为了获得感知上更为适当的测量,可逐渐地(progressively)对室内响应或室内能量量度进行平滑以便在最低频率处捕捉基本上整个时间响应,而在最高频率处捕捉实质上仅仅是直接路径加上几毫秒的时间响应。一个或多于一个处理器根据室内能量量度计算滤波器系数,其用于对一个或多于一个处理器内的数字校正滤波器进行配置。一个或多于一个处理器可针对声道目标曲线、用户定义的或平滑后的版本的声道能量量度计算滤波器系数,然后,可将滤波器系数调节为共同目标曲线,该共同目标曲线可以是用户定义的或声道目标曲线的平均。一个或多于一个处理器使音频信号通过对应的数字校正滤波器并且到达扬声器以便回放到收听环境之中。
[0016] 在用于产生用于多声道音频系统的子频带校正滤波器的实施例中,在A/V前置放大器的一个或多于一个处理器中提供:将音频信号下采样到P个子频带的基带的P频带过采样分析滤波器组,和对P个子频带上采样以重建音频信号的P频带过采样合成滤波器组,其中,P是整数。针对每个声道提供频谱量度。一个或多于一个处理器将每个频谱量度与声道目标曲线合并(combine)以便提供每声道的聚集频谱量度。对于每个声道,一个或多于一个处理器提取聚集频谱量度的与不同子频带对应的部分,并将频谱量度的所提取部分重新映射到基带,以便模拟分析滤波器组的下采样。一个或多于一个处理器计算到每个子频带的重新映射后的频谱量度的自动回归(AR)模型,并将每个AR模型的系数映射到最小相位全零子频带校正滤波器的系数。通过计算作为重新映射后的频谱量度的逆FFT的自相关序列并将莱文逊-德宾(Levinson-Durbin)算法应用于自相关序列以计算AR模型,一个或多于一个处理器可计算AR模型。莱文逊-德宾算法产生子频带的剩余功率估算值,其可用于选择校正滤波器的阶数。一个或多于一个处理器根据对应的系数配置P个数字全零子频带校正滤波器,其对在分析和合成滤波器组之间的P个基带音频信号进行频率校正。一个或多于一个处理器可针对声道目标曲线、用户定义的或平滑后的版本的声道能量量度计算滤波器系数,然后,可将滤波器系数调节为共同目标曲线,该共同目标曲线可以是声道目标曲线的平均。
[0017] 结合附图,从下面对优选实施例的详细介绍中,本领域技术人员将会清楚本发明的这些以及其他特征和优点,在附图中:

附图说明

[0018] 图1a和1b分别是处于分析模式的收听环境和多声道音频回放系统的实施例的框图以及四面体(tetrahedral)麦克风的实施例的图示;
[0019] 图2是处于回放模式的收听环境和多声道音频回放系统的实施例的框图;
[0020] 图3是处于回放模式的子频带滤波器组的实施例的框图,该子频带滤波器组适用于对在分析模式中确定的扬声器/室内频率响应的偏差进行校正;
[0021] 图4是分析模式的实施例的流程图
[0022] 图5a到5d是全通(all-pass)探测信号的时间、频率和自相关序列;
[0023] 图6a到6b是预加重探测信号的时间序列和幅度谱;
[0024] 图7是用于从同一频域信号产生全通探测信号和预加重探测信号的实施例的流程图;
[0025] 图8是用于对探测信号发送进行调度以进行采集的实施例的图示;
[0026] 图9是用于探测信号的实时采集处理以提供室内响应和延迟的实施例的框图;
[0027] 图10是用于对室内响应进行后处理以提供校正滤波器的实施例的流程图;
[0028] 图11是从宽带探测信号和预加重探测信号的频谱量度混合的室内频谱量度的实施例的图示;
[0029] 图12是用于针对不同探测信号和麦克风组合计算能量量度的实施例的流程图;
[0030] 图13是用于对能量量度进行处理以计算能量校正滤波器的实施例的流程图;以及
[0031] 图14a到14c是示出用于能量量度的提取以及到基带的重新映射以便模拟分析滤波器组的下采样的实施例的图示。

具体实施方式

[0032] 本发明提供了这样的装置和方法:其适用于对多声道扬声器配置进行特征化,对扬声器/室内延迟、增益和频率响应进行校正,或者对子频带域校正滤波器进行配置。多种装置和方法适用于自动定位空间中的扬声器以确定音频声道是否被连接,选择特定的多声道扬声器配置,并在收听环境中对各扬声器进行定位。多种装置和方法适用于提取在感知上合适的能量量度,该能量量度在低频率处既对声压又对声速进行捕捉,并在宽广的收听区域上是准确的。能量量度根据通过使用在收听环境中放置在单个位置的紧密间隔的非重合多麦克风阵列收集的室内响应得出且用于对数字校正滤波器进行配置。多种装置和方法适用于对子频带校正滤波器进行配置,以便针对由例如室内响应和扬声器响应导致的与目标响应的偏差对输入多声道音频信号的频率响应进行校正。频谱量度(例如室内频谱/能量量度)被分割(partition)并重新映射到基带以便模拟分析滤波器组的下采样。对于每个子频带独立计算AR模型,并将模型的系数映射到全零最小相位滤波器。值得注意的是,分析滤波器的形状不包括在重新映射中。子频带滤波器实现方式可被配置为对MIPS、存储器要求以及处理延迟进行平衡,并可伴随分析/合成滤波器组架构使用,如果对于其他音频处理已经存在分析/合成滤波器组架构的话。
[0033] 多声道音频分析和回放系统
[0034] 现在参照附图,图1a-1b、2和3示出了多声道音频系统10的一实施例,该系统用于探测和分析收听环境14中的多声道扬声器配置12,以便自动选择多声道扬声器配置并在室内对扬声器进行定位,提取在宽广的收听区域上的感知上合适的频谱(例如能量)量度,并对频率校正滤波器进行配置,该系统还用于在室内校正(延迟、增益和频率)的情况下多声道音频信号16的回放。多声道音频信号16可经由线缆或卫星馈送提供,或者可从例TM如DVD或Blu-Ray 盘的存储介质读取。音频信号16可与被提供给电视18的视频信号成对。可替代地,音频信号16可以是不具有视频信号的音乐信号。
[0035] 多声道音频系统10包括:音频源20,例如线缆或卫星接收器或是DVD或Blu-RayTM播放器,其用于提供多声道音频信号16;A/V前置放大器22,其将多声道音频信号解码到音频输出24处的分立音频声道中;以及,耦合到相应的音频输出24的多个扬声器26(声换能器(transducer)),其将由A/V前置放大器供给的电信号转换为作为声波28发送到收听环境14之中的声学响应。音频输出24可以是硬接线到扬声器的端子或无线耦合到扬声器的无线输出。如果音频输出被耦合到扬声器,则对应的音频声道称为被连接。扬声器可以是以离散2D或3D布局布置的个体扬声器或是各自包括被配置为对环绕声体验进行仿真的多个扬声器的长条形音箱。该系统还包括麦克风组件,麦克风组件包括一个或多于一个麦克风30以及麦克风发送盒32。一个或多于一个麦克风(声电换能器)接收与供给到扬声器的探测信号相关联的声波,并将声学响应转换为电信号。发送盒32将电信号通过有线或无线连接供给到A/V前置放大器的一个或多于一个的音频输入34。
[0036] A/V前置放大器22包括:一个或多于一个处理器36,例如通用计算机处理单元(CPU)或专用数字信号处理器(DSP)芯片,其通常具有自己的处理器存储器;系统存储器38;和连接到音频输出24的数模转换器和放大器40。在某些系统配置中,D/A转换器和/或放大器可以是分立的装置。例如,A/V前置放大器可向将模拟信号输出到功率放大器的D/A转换器输出校正后的数字信号。为了实现分析和回放工作模式,计算机程序指令的多种“模”被存储在存储器、处理器或系统中,并由一个或多于一个处理器36执行。
[0037] A/V前置放大器22还包括输入接收器42,其连接到一个或多于一个音频输入34,以接收输入麦克风信号并向一个或多于一个处理器36提供分立的麦克风声道。麦克风发送盒32和输入接收器42是匹配的一对。例如,发送盒32可包括麦克风模拟前置放大器、A/D转换器和TDM(时域复用器)或A/D转换器、封装器以及USB发送器,且匹配的输入接收器42可包括模拟前置放大器和A/D转换器、SPDIF接收器和TDM解复用器或USB接收器和解封装器。A/V前置放大器可包括用于各个麦克风信号的音频输入34。可替代地,多个麦克风信号可复用为单个信号并供给到单个音频输入34。
[0038] 为了支持分析工作模式(在图4中示出),A/V前置放大器设有探测产生和发送调度模块44以及室内分析模块46。如图5a-5d、6a-6b、7以及8所详细示出的,模块44产生宽带探测信号以及可能的成对预加重探测信号,并根据调度在由静默时段分隔开的非重叠时隙内经由A/D转换器和放大器40将探测信号发送到各个音频输出24。就输出是否耦合到扬声器对各个音频输出24进行探测。模块44将一个或多于一个探测信号以及发送调度提供给室内分析模块46。如图9到14详细示出的,模块46根据发送调度对麦克风信号和探测信号进行处理,以便自动选择多声道扬声器配置并在室内对扬声器进行定位,提取在宽广的收听区域上的感知上合适的频谱(能量)量度,并对频率校正滤波器(例如子频带频率校正滤波器)进行配置。模块46在系统存储器38中存储扬声器配置、扬声器位置以及滤波器系数。
[0039] 麦克风30的数量和布局影响分析模块选择多声道扬声器配置并定位扬声器以及提取在宽广收听区域上有效的感知上合适的能量量度的能。为了支持这些功能,麦克风布局必须提供一定量的多样性,以便在两个或三个维度对扬声器进行“定位”并计算声速。一般地,麦克风是非重合的,并具有固定的间距。例如,单个麦克风仅仅支持到扬声器的距离的估算。一对麦克风支持对到扬声器的距离以及半平面(前、后或任一侧)内的例如方位角的角度的估算以及对单个方向上的声速的估算。三个麦克风支持对到扬声器的距离以及整个平面(前、后以及两侧)内的方位角的估算以及对三维空间中的声速的估算。位于三维球上的四个或多于四个的麦克风支持对到扬声器的距离的估算以及对整个三维空间内仰角和方位角的估算以及对三维空间内声速的估算。
[0040] 图1b示出了对于四面体麦克风阵列的情况以及对于特别选择的坐标系的多麦克风阵列48的实施例。四个麦克风30被放置在四面体对象(“球”)49的顶点处。所有麦克风假设是全向的,即麦克风信号表示不同位置处的压力测量。麦克风1、2和3位于x,y平面,麦克风1位于坐标系的原点,且麦克风2和3与x轴等距。麦克风4位于x,y平面之外。各麦克风之间的距离相等并用d表示。到达方向(DOA)表示声波到达方向(用于在附录A中的定位过程)。麦克风间隔“d”代表需要小间隔以准确计算高达500Hz到1kHz的声速以及需要大间隔以准确定位扬声器的折衷。大约8.5到9cm的间隔满足这两个要求。
[0041] 为了支持回放工作模式,A/V前置放大器设有输入接收器/解码器模块52和音频回放模块54。输入接收器/解码器模块52将多声道音频信号16解码到分立的音频声道。例如,多声道音频信号16可以以标准两声道格式递送。模块52处理将两声道Dolby TMSurround、Dolby Digital、DTS Digital Surround 或 信号解码到相应的分
立音频声道的工作。模块54处理各个音频声道,以便进行一般化的格式转换以及扬声器/室内校准和校正。例如,模块54可执行上混频或下混频、扬声器重新映射或虚拟化,应用延迟、增益或极性补偿,执行低音管理并执行室内频率校正。模块54可使用由分析模式产生并存储在系统存储器38中的频率校正参数(例如延迟和增益调节以及滤波器系数)来对于每个音频声道配置一个或多于一个的数字频率校正滤波器。频率校正滤波器可在时域、频域或子频带域中实现。使每个音频声道通过其频率校正滤波器并转换为对扬声器进行驱动的模拟音频信号以产生声学响应,声学响应作为声波被发送到收听环境中。
[0042] 图3示出了在子频带域中实现的数字频率校正滤波器56的实施例。滤波器56包括P频带复合非临界(non-critically)采样分析滤波器组58、包括用于P个子频带的P个最小相位FIR(有限脉冲响应)滤波器62的室内频率校正滤波器60以及P频带复合非临界采样合成滤波器组64,其中,P是整数。如所示出的,室内频率校正滤波器60已经加到已TM有的滤波器架构,例如DTS NEO-X ,其在子频带域中执行一般化的上混频/下混频/扬声器重新映射/虚拟化功能66。基于子频带的室内频率校正的主要计算在于分析和合成滤波TM
器组的实现。将室内校正加到已有的子频带架构(例如DTS NEO-X )所施加的处理要求的增量增大是最小的。
[0043] 通过使音频信号(例如输入的PCM采样)首先通过过采样分析滤波器组58、接着在各个频带中独立应用适当地具有不同长度的最小相位FIR校正滤波器62、最后应用合成滤波器组64以产生频率校正后的输出PCM音频信号,在子频带域中进行频率校正。由于频率校正滤波器被设计为最小相位,所以子频带信号即使在经过不同长度滤波器后仍是在频带之间时间对准的。因此,这种频率校正方法所引入的延迟仅仅由分析以及合成滤波器组的链中的延迟决定。在具有64频带过采样复合滤波器组的特定实施方式中,此延迟小于20毫秒。
[0044] 采集、室内响应处理和滤波器构建
[0045] 图4示出了对于分析工作模式的实施例的高层次流程图。一般地,分析模块产生宽带探测信号以及可能的预加重探测信号,根据调度将探测信号经过扬声器作为声波发送到收听环境中,并记录在麦克风阵列处检测到的声学响应。模块计算在各个麦克风及各个探测信号处的各个扬声器的延迟和室内响应。这种处理可以在发送下一个探测信号之前“实时”进行,或在所有探测信号已被发送且麦克风信号已被记录之后离线进行。模块对室内响应进行处理,以计算各个扬声器的频谱(例如能量)量度,并使用频谱量度,计算频率校正滤波器和增益调节。再一次地,这种处理可在发送下一探测信号之前的静默时段中或是离线进行。采集和室内响应处理是实时还是离线进行是以每秒百万条指令计的计算、存储器以及整体采集时间的折衷,并依赖于特定A/V前置放大器的资源和要求。模块使用计算得到的各个扬声器的延迟来对于各个连接的声道确定到扬声器的距离以及至少是方位角,并使用该信息来自动选择特定的多声道配置以及计算收听环境中各个扬声器的位置。
[0046] 分析模式通过初始化系统参数以及分析模块参数而开始(步骤70)。系统参数可包括可用声道的数量(NumCh)、麦克风的数量(NumMics)以及基于麦克风灵敏度、输出电平等的输出音量设置。分析模块参数包括一个或多于一个探测信号S(宽带)和PeS(预加重)以及用于将信号发送到各个可用声道的调度。一个或多于一个探测信号可存储在系统存储器中或在分析发起时产生。调度可存储在系统存储器中或在分析发起时产生。调度将一个或多于一个探测信号供给到音频输出,使得各个探测信号在由静默时段分隔的非重叠时隙中作为声波被扬声器发送到收听环境中。静默时段的范围将至少部分地依赖于在发送下一个探测信号之前是否执行任何处理。
[0047] 第一探测信号S是宽带序列,其以在指定声学频带上基本恒定的幅度谱为特征。与声学频带内的恒定幅度谱的偏差牺牲信噪比(SNR),其影响室内和校正滤波器的特征化。
系统规格可规定与声学频带上的常数的最大dB偏差。第二探测信号PeS是预加重序列,其以应用到基带序列的预加重函数为特征,该函数在指定的声学频带的一部分上提供放大的幅度谱。预加重序列可从宽带序列得出。一般地,第二探测信号可对于部分或全部与指定声学频带重叠的特定目标频带内的噪声整形或衰减有用。在特定的应用中,预加重函数的幅度与在和指定声学频带的低频率区域重叠的目标频带中的频率成反比。当与多麦克风阵列结合使用时,双探测信号提供在噪声存在时更具鲁棒性的声速计算。
[0048] 前置放大器的探测产生和发送调度模块根据调度发起一个或多于一个探测信号的发送以及一个或多于一个麦克风信号P和PeP的捕捉(步骤72)。一个或多于一个探测信号(S和PeS)以及捕捉的一个或多于一个麦克风信号(P和PeP)被提供给室内分析模块,以进行室内响应采集(步骤74)。这种采集输出室内响应——或是时域室内脉冲响应(RIR)或是频域室内频率响应(RFR)——以及各个扬声器在各个所捕捉的麦克风信号处的延迟。
[0049] 一般地,采集过程涉及用探测信号对一个或多于一个麦克风信号的解卷积,以便提取室内响应。宽带麦克风信号用宽带探测信号进行解卷积。预加重的麦克风信号可用预加重的麦克风信号或其基带序列——其可以是宽带探测信号——进行解卷积。将预加重麦克风信号用其基带序列进行解卷积将预加重函数叠加到室内响应上。
[0050] 解卷积可通过计算麦克风信号的FFT(快速傅立叶变换)、计算探测信号的FFT并将麦克风频率响应除以探测频率响应以构成室内频率响应(RFR)来进行。通过计算RFR的逆FFT来提供RIR。通过记录整体麦克风信号并对整体麦克风信号和探测信号计算单次FFT,解卷积可“离线”进行。这可在探测信号之间的静默时段进行,然而,静默时段的持续时间可能需要增大以容纳计算。可替代地,对于所有声道的麦克风信号可在任何处理开始之前记录并存储在存储器中。通过在其被捕捉时将麦克风信号分割为块并基于分割来对麦克风和探测信号计算FFT,解卷积可“实时”进行(见图9)。“实时”方法倾向于减小存储器要求,但增大采集时间。
[0051] 采集也需要对于各个扬声器计算各个所捕捉的麦克风信号处的延迟。延迟可根据探测信号和麦克风信号使用许多不同的技术计算,包括信号互相关、交叉频谱相位或分析包络,例如希尔伯特包络(HE)。例如,延迟可对应于HE中的显著峰值(例如,超过所定义阈值的最大峰值)的位置。产生时域序列的例如HE的技术可在峰值附近内插,以便用采样间隔时间精度的一部分(fraction)在更精细的时间尺度上计算新的峰值位置。采样间隔时间是接收到的麦克风信号被采样的间隔,并应当选择为小于或等于要被采样的最大频率的倒数的一半,如现有技术中已知的那样。
[0052] 采集还需要判断音频输出是否实际上耦合到扬声器。如果端子未被耦合,则麦克风仍将拾取并记录任何环境信号,但互相关、交叉频谱相位/分析包络将不表现出指示扬声器连接的显著峰值。采集模块记录最大峰值,并将之与阈值进行比较。如果峰值超过峰值,则将SpeakerActivityMask[nch]设置为真,并将音频声道看作连接的。这种判断可在静默时段期间作出或在离线作出。
[0053] 对于各个连接的音频声道,分析模块对各个麦克风处来自各个扬声器的延迟和室内响应(RIR或RFR)进行处理,并输出各个扬声器的室内频谱量度(步骤76)。这种室内响应处理可在发送下一个探测信号之前的静默时段期间进行或在所有探测和采集结束后离线进行。最简单而言,室内频谱量度可包括单个麦克风的RFR,可能在多个麦克风上被平均,并可能被混合以便使用较高频率处的宽带RFR以及较低频率处的预加重RFR。室内响应的进一步的处理可得出感知上更为合适的频谱响应以及在更宽广的收听区域上有效的频谱响应。
[0054] 除通常的增益/距离问题之外,标准室内(收听环境)存在几个声学问题,其影响可测量、计算以及应用室内校正的方式。为了理解这些问题,应当考虑感知问题。特别地,“第一到达”——也称为人类听觉中的“优先效应”——的作用在成像和音色的实际感知中起着作用。在除消音室以外的任何收听环境中,“直接”音色——其意味着声音源的实际感知音色——受到第一到达(直接来自扬声器/仪器的)声音和最初的几次反射的影响。在理解此直接音色之后,收听者将该音色和房间内反射的、后来的声音的音色进行比较。这例如有助于类似于前/后消歧等问题,因为头部相关传递函数(HRTF)对朵的直接对(vs.)全空间功率响应的影响的比较是已知的并且学会使用的。一种考虑是,如果直接信号具有与加权非直接信号相比更高的频率,则其通常听起来是“前方的”,而缺少高频的直接信号将定位在收听者的后方。这种效应从大约2kHz以上是最强的。由于听觉系统的本性,从低频截止到大约500Hz的信号通过一种方法定位,而高于它的信号通过另一方法定位。
[0055] 除了由于第一到达引起的高频感知效应以外,物理声学在室内补偿中占很大一部分。大多数扬声器并不具有整体平坦的功率辐射曲线,即使对第一到达而言它们确实接近这种理想。这意味着与在较低频率处相比,收听环境在较高频率处将由较小的能量驱动。这单独地意味着如果使用长期能量平均进行补偿计算,则将对直接信号施加不希望的预加重。遗憾的是,情况因典型的室内音质而恶化,这是因为通常在较高频率处,墙壁、家具、人等将吸收更多能量,这降低室内能量存储(即T60),导致长期测量具有对直接音色的更大误导关系。
[0056] 因此,我们的方法在较低频率(由于耳蜗滤波器的较长脉冲响应)处以长的测量时段并在较高频率处以较短的测量时段在由实际耳蜗力学决定的直接声音范围中进行测量。从较低频率到较高频率的转变是平滑地变化的。此时间间隔可由t=2/ERB带宽规则近似,其中,ERB是直到“t”达到几毫秒的下限为止的等效矩形带宽,在该下限时刻,听觉系统中的其他因素暗示时间不应进一步缩短。这种“逐渐平滑”可以在室内脉冲响应或室内频谱量度上执行。也可执行逐渐平滑,以提升感知收听。感知收听促进收听者处理双耳处的音频信号。
[0057] 在低频率即长波长处,与声压或任何速度轴单独比较,声音能量在不同位置上变化很小。使用来自非重合多麦克风阵列的测量结果,模块在低频率处计算总能量量度,其不仅考虑到声压,而且考虑到声速,优选为在所有方向上的。通过这样做,模块从一点捕捉室内在低频率处的实际存储能量。这方便地允许A/V前置放大器避免在存在过多存储——即使是测量点处的压力并未揭示这种存储——的频率处向室内辐射能量,因为压力零将与体积速度的最大值一致。当与多麦克风阵列结合使用时,双探测信号提供在噪声存在的情况下更具鲁棒性的室内响应。
[0058] 分析模块使用室内频谱(例如,能量)量度来计算对于各个连接的音频声道的频率校正滤波器和增益调整,并将参数存储在系统存储器中(步骤78)。许多不同的架构,包括时域滤波器(例如,FIR或IIR)、频域滤波器(例如,通过重叠相加、重叠保存实现的FIR)及子频带域滤波器,可用于提供扬声器/室内频率校正。极低频率处的室内校正需要具有可容易达到几百毫秒持续时间的脉冲响应的校正滤波器。在每周期所需要的操作方面,实现这些滤波器的最有效的方式是在频域中使用重叠保存(overlap-save)或重叠相加(overlap-add)方法。由于所需FFT的大尺寸,继承延迟和存储器需求对某些消费类电子应用来说可能是难以接受的。如果使用分割FFT方法,延迟可减少,而付出的代价是每周期操作数量的增大。然而,此方法仍然有高存储器需求。当处理在子频带域中执行时,有可能对每周期所需操作数量、存储器需求以及处理延迟之间的折衷进行精细调节。子频带域中的频率校正可有效利用不同频率区域中不同阶的滤波器,尤其是在极少数子频带中的滤波器(如在具有极少低频率频带的室内校正情况下)具有与所有其他子频带中的滤波器相比远远更高的阶数的情况下。如果捕捉的室内响应在较低频率处使用长测量时段并且向着较高频率使用逐渐较短的测量时段来处理,则随着从低频率向高频率进行滤波,室内校正滤波需要甚至更低阶的滤波器。在这种情况下,基于子频带的室内频率校正滤波方法提供与使用重叠保存或重叠相加方法的快速卷积类似的计算复杂度;然而,子频带域方法以低得多的存储器需求以及低得多的处理延迟实现这一点。
[0059] 一旦所有音频声道都已得到处理,分析模块自动选择扬声器的特定多声道配置,并计算收听环境内的各个扬声器的位置(步骤80)。模块使用从各个扬声器到各个麦克风的延迟来确定距离和至少方位角,以及优选为在定义的3D坐标系中到扬声器的仰角。模块解算方位角和仰角的能力取决于麦克风的数量以及接收到的信号的多样性。模块将延迟重新调节为对应于从扬声器到坐标系原点的延迟。基于给定的系统电子传播延迟,模块计算对应于从扬声器到原点的空气传播的绝对延迟。基于此延迟以及恒定的声速,模块计算到各个扬声器的绝对距离。
[0060] 使用各个扬声器的距离和角度,模块选择最接近的多声道扬声器配置。由于房间的物理特征或是用户失误或偏好,扬声器位置可能并不与支持的配置精确对应。预定义扬声器位置的表格——其依据行业标准适当地规定——被保存在存储器中。标准环绕声扬声器近似位于水平面中——例如,仰角大致为零——并指定方位角。任何高度的扬声器可具有例如30和60度之间的仰角。下面是这种表格的实例。
[0061]
[0062]
[0063] 当前行业标准指定从单声道到5.1的大约九种不同的布局。
[0064] 当前指定四种6.1配置:
[0065] ——C+LR+LsRs+Cs
[0066] ——C+LR+LsRs+Oh
[0067] ——LR+LsRs+LhRh
[0068] ——LR+LsRs+LcRc
[0069] 以及七种7.1配置:
[0070] ——C+LR+LFE1+LsrRsr+LssRss
[0071] ——C+LR+LsRs+LFE1+LhsRhs
[0072] ——C+LR+LsRs+LFE1+LhRh
[0073] ——C+LR+LsRs+LFE1+LsrRsr
[0074] ——C+LR+LsRs+LFE1+Cs+Ch
[0075] ——C+LR+LsRs+LFE1+Cs+Oh
[0076] ——C+LR+LsRs+LFE1+LwRw
[0077] 随着行业向着3D发展,将定义更多的行业标准以及 布局。在给定所连接声道的数量以及这些声道的距离和角度的情况下,模块从表格中识别个体扬声器的位置,并选择与规定多声道配置最接近的匹配。“最接近的匹配”可通过误差度量或通过逻辑来确定。例如,误差度量可计数与特定配置的正确匹配数量,或计算到特定配置中的所有扬声器的距离(例如,平方误差的总和)。逻辑可用最大扬声器匹配数量来识别一个或多于一个候选配置,并接着基于任何不匹配来确定哪一候选配置是最有可能的。
[0078] 分析模块将各个音频声道的延迟及增益调整以及滤波器系数存储在系统存储器中(步骤82)。
[0079] 一个或多于一个探测信号可被设计为允许有效且准确地测量室内响应并计算在宽广收听区域上有效的能量量度。第一探测信号是宽带序列,其特征是在指定声学频带上基本上恒定的幅度谱。与在指定声学频带上的“常数”的偏差产生在这些频率处的SNR损耗。通常,设计规格将规定指定声学频带上的幅度谱中的最大偏差。
[0080] 探测信号和采集
[0081] 一种版本的第一探测信号S是如图5a所示的全通序列100。如图5b所示,全通序列APP的幅度谱102在所有频率上近似于恒定(即,0dB)。此探测信号具有非常窄的峰值的自相关序列104,如图5c和5d所示。峰值的狭窄度与幅度谱在其上为恒定的带宽成反比。自相关序列的零滞后值远远超过任何非零滞后值,且不重复。数量取决于序列的长度。1,024(210)个样本的序列将具有超出任何非零滞后值至少30dB的零滞后值,而65,536(216)个样本的序列将具有超出任何非零滞后值至少60dB的零滞后值。非零滞后值越低,噪声抑制越大,且延迟越准确。全通序列使得在室内响应采集过程中,室内能量将同时对所有频率被建立。与扫掠式(sweeping)正弦探测相比,这允许较短的探测长度。另外,全通激励使扬声器更接近于其标称工作模式地运行。同时,这种探测允许扬声器/室内响应的准确的全带宽测量,从而允许非常快的整体测量过程。216个样本的探测长度允许0.73Hz的频率分辨率
[0082] 第二探测信号可被设计为用于在可能与第一探测信号的指定声学频带部分或全部重叠的特定目标频带中的噪声整形或衰减。第二探测信号是预加重序列,其特征是应用到基带序列的预加重函数,该函数在指定声学频带的一部分上提供放大的幅度谱。由于该序列在声学频带的一部分上具有放大的幅度谱(>0dB),所以它将在声学频带的其他部分上表现出衰减的幅度谱(<0dB)以获得能量守恒,因此,不适合用作第一或首要探测信号。
[0083] 如图6a所示的一种版本的第二探测信号PeS是预加重序列110,其中,应用于基带序列的预加重函数与频率(c/ωd)成反比,其中,c是声速,且d是在指定声学频带的低频率区域上的麦克风的间距。注意,径向频率ω=2πf,其中,f是Hz。由于这两者由恒定的比例因子表示,所以它们可互换地使用。另外,为简化起见,对频率的函数依赖性可被省略。如图6b所示,幅度谱112与频率成反比。对于小于500Hz的频率,幅度谱为>0dB。最低频率处,放大被钳位在20dB。使用第二探测信号以便在低频率处计算室内频谱量度具有这样的优点:在单个麦克风的情况下衰减低频率噪声,以及,在多麦克风阵列的情况下衰减压力分量中的低频率噪声并改善速度分量的计算。
[0084] 存在多种不同的方式来构建第一宽带探测信号和第二预加重探测信号。第二预加重探测信号根据基带序列产生,该基带序列可以是、或者可以不是第一探测信号的宽带序列。图7示出用于构建全通探测信号以及预加重探测信号的方法的实施例。
[0085] 根据本发明一个实施例,优选为,通过产生-π,+π之间且长度为2n幂的随机数序列而在频域中构建探测信号(步骤120)。存在许多已知的技术来产生随机数序列,基于Mersenne Twister算法的MATLAB(Matrix Laboratory)“rand”函数可适当地用于本发明,以产生均匀分布的伪随机序列。将平滑滤波器(例如,重叠的高通和低通滤波器的组合)应用于随机数序列(步骤121)。在频率响应的相位 呈现全通幅度时,随机序列被用于在频域中产生全通探测序列S(f)(步骤122)。全通幅度是 ,其中,S(f)是共轭对称的(即,负频率部分被设置为正部分的复共轭)。在时域中计算S(f)的逆FFT(步骤124)并对之进行归一化(步骤126),以产生第一全通探测信号S(n),其中,n是时间上的样本索引。定义依赖于频率(c/ωd)的预加重函数Pe(f)(步骤128)并将之应用于全通频域信号S(f)以产生PeS(f)(步骤130)。PeP(f)可在最低频率处被限制(bound)或钳位(步骤132)。计算PeS(f)的逆FFT(步骤134),对之进行检查以确保没有严重的边缘效应,并对之进行归一化以使其在避免钳位的同时具有高电平(步骤136),从而产生时域中的第二预加重探测信号PeS(n)。一个或多于一个探测信号可离线计算并存储在存储器中。
[0086] 如图8所示,在一实施例中,A/V前置放大器依据发送调度140将一个或多于一个的探测信号——持续时间(长度)为“P”的全通探测(APP)以及预加重探测(PES)——提供给音频输出,使得各个探测信号在由静默时段分隔开的非重叠时隙中作为声波被扬声器发送到收听环境之中。前置放大器每次向一个扬声器发送一个探测信号。在双探测的情况下,全通探测APP首先被发送到单个扬声器,并且,在预定的静默时段之后,预加重探测信号PES被发送到同一扬声器。
[0087] 在去向同一扬声器的第一和第二探测信号的发送之间插入静默时段“S”。分别在第一和第二扬声器之间以及第k个和第k+1个扬声器之间的第一和第二探测信号的发送之间插入静默时段S1,2以及Sk,k+1,以便实现鲁棒而快速的采集。静默时段S的最小持续时间是将要采集的最大RIR长度。静默时段S1,2的最小持续时间是最大RIR长度和通过系统的最大假定延迟之和。静默时段Sk,k+1的最小持续时间由(a)要采集的最大RIR长度、(b)扬声器之间的最大假定相对延迟的两倍、以及(c)室内响应处理块长度的两倍之和施加。如果处理器在静默时段执行采集处理或室内响应处理并需要更多时间来完成计算,则可增大到不同扬声器的探测之间的静默。第一声道被适当地探测两次,一次在开始时且一次在所有其他扬声器之后以检验延迟的一致性。总的系统采集长度Sys_Acq_Len=2*P+S+S1,2+N_LoudSpkrs*(2*P+S+Sk,k+1)。在探测长度为65,536且对六个扬声器的双探测测试的情况下,总采集时间可小于31秒。
[0088] 如前所述,基于非常长的FFT对所捕捉的麦克风信号进行解卷积的方法适合用于离线处理情境。在这种情况下,假定前置放大器具有足够的存储器来存储整个所捕捉的麦克风信号,且仅仅在捕捉过程完成之后开始估算传播延迟以及室内响应。
[0089] 在室内响应采集的DSP实现方式中,为了使所需存储器以及所需采集过程持续时间最小化,A/V前置放大器在捕捉麦克风信号的同时适当地实时进行解卷积以及延迟估算。用于延迟以及室内响应的实时估算的方法可根据存储器、MIPS以及采集时间要求之间的折衷而针对不同的系统要求被定制:
[0090] ·对所捕捉的麦克风信号的解卷积经由匹配的滤波器进行,该匹配的滤波器的脉冲响应是时间反演的探测序列(即,对于65536个样本的探测,我们具有65536个抽头的FIR滤波器)。为了降低复杂度,匹配的滤波在频域中进行,并且,为了降低存储器需求和处理延迟,在50%重叠的情况下使用分割FFT重叠保存方法。
[0091] ·在每一块中,此方法产生对应于候选室内脉冲响应的特定时间部分的候选频率响应。对于每个块,进行逆FFT,以获得候选室内脉冲响应(RIR)的新样本块。
[0092] ·同样地,根据同一候选频率响应,通过使其值对于负的频率为零,对结果应用IFFT并取IFFT的绝对值,获得候选室内脉冲响应的分析包络(AE)的新样本块。在一实施例中,AE是希尔伯特包络(HE)。
[0093] ·跟踪AE的全局峰值(在所有块上)并记录其位置。
[0094] ·RIR以及AE被记录以在AE全局峰值位置之前开始预定数量的样本;这允许室内响应处理期间对传播延迟进行精细调谐。
[0095] ·在每个新块中,如果找到AE的新全局峰值,则对先前记录的候选RIR以及AE进行复位,并开始记录新的候选RIR以及AE。
[0096] ·为了减少误检测,将AE全局峰值搜索空间限制到预期的区域;对于各个扬声器的这些预期区域取决于通过系统的假定最大延迟以及扬声器之间的最大假定相对延迟。
[0097] 现在参照图9,在一特定实施例中,对N/2个样本(具有50%的重叠)的各个连续块进行处理以更新RIR。对于每个麦克风对每个块执行N点FFT,以输出长度为N×1的频率响应(步骤150)。对于每个麦克风信号的当前FFT分割(仅非负频率)被存储在长度为(N/2+1)x1的向量中(步骤152)。这些向量在先进先出(FIFO)的基础上累积,以产生有着维度为(N/2+1)x K的K个FFT分割的矩阵Input_FFT_Matrix(步骤154)。长度为K*N/2个样本的时间反演宽带探测信号的一组分割FFT(仅非负频率)被预先计算并存储为维度为(N/2+1)x K的矩阵Filt_FFT(步骤156)。用Filt_FFT矩阵对Input_FFT_Matrix执行使用重叠保存方法的快速卷积,以便为当前块提供N/2+1点的候选频率响应(步骤158)。重叠保存方法将Filt_FFT_matrix的各频率槽(bin)中的值乘以Input_FFT_Matrix中的对应值,并跨矩阵的K个列对值求平均。对于每个块,对于负频率用共轭对称延伸来进行N点逆FFT,以获得候选室内脉冲响应(RIR)的N/2x1个样本的新块(步骤160)。候选RIR的连续块被附加并存储,一直到指定的RIR长度(RIR_Length)(步骤162)。
[0098] 同样地,根据同一候选频率响应,通过使其值对于负频率为零,对结果应用IFFT并取IFFT的绝对值,获得候选室内脉冲响应的HE的N/2×1个样本的新块(步骤164)。对N/2个样本的传入块的HE的最大值(峰值)进行跟踪和更新,以跟踪所有块上的全局峰值(步骤166)。存储其全局峰值附近的HE的M个样本(步骤168)。如果检测到新的全局峰值,则发布控制信号以刷新所存储的候选RIR并重新开始。DSP输出RIR、HE峰值位置及其峰值附近的HE的M个样本。
[0099] 在使用双探测方法的实施例中,以同样的方式对预加重探测信号进行处理以产生候选RIR,候选RIR被存储,直至RIR_Length(步骤170)。对于全通探测信号的HE的全局峰值的位置用于开始对候选RIR的累积。DSP输出对于预加重探测信号的RIR。
[0100] 室内响应处理
[0101] 一旦采集过程完成,通过受耳蜗力学启发的时频处理(time-frequency processing)来处理室内响应,其中,在较低频率处考虑室内响应的较长部分,并在越来越高的频率处考虑室内响应的逐渐变短的部分。可对时域RIR或是频域频谱量度执行这种可变分辨率的时频处理。
[0102] 图10示出室内响应处理的方法的实施例。音频声道指示符nch被设定为零(步骤200)。如果SpeakerActivityMask[nch]非真(即,没有更多的扬声器被耦合)(步骤202),则循环处理终止并跳到将所有校正滤波器调节为共同目标曲线的最后步骤。否则,过程视情况可选地向RIR应用可变分辨率的时频处理(步骤204)。将时变滤波器应用到RIR。该时变滤波器被构建为:使得RIR的开始完全不被滤波,但是,随着滤波器通过RIR在时间上行进,应用低通滤波器,该低通滤波器的带宽随着时间逝去而逐渐变小。
[0103] 用于构建并应用时变滤波器到RIR的示例性过程如下:
[0104] ·使RIR的最初的几毫秒不变(所有频率存在)
[0105] ·进入RIR的几毫秒开始向RIR应用时变低通滤波器
[0106] ·低通滤波器的时间变化可分阶段进行:
[0107] o每一阶段对应于RIR内的特定时间间隔
[0108] o此时间间隔与前一阶段的时间间隔相比可以2x的因子增大
[0109] o两个连续阶段之间的时间间隔可能重叠(对应于较早阶段的时间间隔的)50%[0110] o在每一新阶段,低通滤波器可以将其带宽减小50%
[0111] ·初始阶段处的时间间隔应该在几毫秒左右。
[0112] ·时变滤波器的实现可使用重叠相加方法在FFT域中进行;特别地:
[0113] o提取RIR的对应于当前块的一部分
[0114] o向所提取的RIR的块应用窗函数,
[0115] o向当前块应用FFT,
[0116] o与当前阶段低通滤波器的相同尺寸FFT的对应频率槽相乘
[0117] o计算结果的逆FFT以产生输出,
[0118] o提取当前块输出并相加来自前一块的已保存输出
[0119] o保存输出的其余部分以便与下一块组合
[0120] o随着RIR的“当前块”通过RIR在时间上滑动,在相对于前一块重叠50%的情况下,重复这些步骤。
[0121] o块长度可在每一阶段中增大(匹配与阶段相关联的时间间隔的持续时间),在一定阶段处停止增大或者始终均匀。
[0122] 对于不同麦克风的室内响应进行重新对准(步骤206)。在单个麦克风的情况下,不需要重新对准。如果室内响应在时域中被提供为RIR,则对它们进行重新对准,使得各个麦克风中的RIR之间的相对延迟得到恢复,并且,计算FFT,以获得对准后的RFR。如果室内响应在频域中被提供为RFR,通过与麦克风信号之间的相对延迟对应的相移来实现重新对准。对于全通探测信号的各个频率槽k的频率响应是Hk,且对于预加重探测信号的各个频率槽k的频率响应是Hk,pe,其中,对于频率的函数依赖性已被忽略。
[0123] 对于当前音频声道,根据重新对准的RFR构建频谱量度(步骤208)。一般而言,频谱量度可以任意数量的方式根据RFR计算,包括但并不限于幅度谱和能量量度。如图11所示,频谱量度210可混合根据频率低于截止频率槽kt的预加重探测信号的频率响应Hk,pe算出的频谱量度212以及根据频率高于截止频率槽kt的宽带探测信号的频率响应Hk算出的频谱量度214。在最简单的情况下,频谱量度通过将高于截止的Hk附加到低于截止的Hk,pe而混合。可替代地,如果需要的话,不同的频谱量度可在截止频率槽附近的转变区域216中组合为加权平均。
[0124] 如果在步骤204中未将可变分辨率的时频处理应用于室内响应,则可将可变分辨率的时频处理应用于频谱量度(步骤220)。将平滑滤波器应用于频谱量度。该平滑滤波器被构建为使得平滑量随频率而增大。
[0125] 用于构建平滑滤波器并将之应用于频谱量度的示例性过程包括使用单极点低通滤波器差分方程并将之应用到频率槽。平滑在九个频带(用Hz表示)中执行:频带1:0-93.8,频带2:93.8-187.5,频带3:187.5-375,频带4:375-750,频带5:750-500,频带6:
1500-3000,频带7:3000-6000,频带8:6000-12000,以及,频带9:12000-24000。平滑使用具有可变指数遗忘因子的前向以及后向频域平均。指数遗忘因子的可变性由频带的带宽(Band_BW)决定,即,Lamda=1-C/Band_BW,其中,C是缩放常数。当从一个频带转变到下一频带时,Lambda的值通过在这两个频带中的Lambda的值之间进行线性内插而获得。
[0126] 一旦已产生最终频谱量度,可计算出频率校正滤波器。为此,系统必须设有希望的校正频率响应或“目标曲线”。此目标曲线是任意室内校正系统的特征声音的主要促成因素之一。一种方法是使用反映用户对所有音频声道的任何偏好的单个共同目标曲线。图10所反映的另一种方法是对每一音频声道产生并保存特有的声道目标曲线(步骤222)并对所有声道产生共同目标曲线(步骤224)。
[0127] 为了校正立体声或多声道成像,室内校正过程应当首先实现室内各个扬声器的第一到达声音的匹配(在时间、振幅和音色方面)。用很粗糙(coarse)的低通滤波器对室内频谱量度进行平滑,使得仅仅保留量度的趋势。换言之,保留扬声器响应的直接路径的趋势,这是因为所有室内贡献被排除或被平滑掉。平滑后的这些直接路径扬声器响应在单独为每一扬声器计算频率校正滤波器过程中用作声道目标曲线(步骤226)。因此,仅需要相对较小阶数的校正滤波器,因为仅需要校正目标附近的峰值及下沉。音频声道指示符nch递增一(步骤228),并对照声道总数NumCh进行测试,以确定是否所有可能的音频声道均已得到处理(步骤230)。如果不是,为下一个音频声道重复整个过程。如果是,过程继续行进以针对共同目标曲线对校正滤波器作出最终调节。
[0128] 在步骤224中,共同目标曲线被产生为所有扬声器上的声道目标曲线的平均。可将任何用户偏好或用户可选择的目标曲线叠加在共同目标曲线之上。作出对校正滤波器的任何调节,以补偿声道目标曲线与共同目标曲线的差异(步骤229)。由于每一声道和共同目标曲线之间相对较小的变化以及高度平滑的曲线,由共同目标曲线施加的要求可用非常简单的滤波器来实现。
[0129] 如先前所提到的,在步骤208中计算出的频谱量度可构成能量量度。图12示出用于对单个麦克风或四面体麦克风以及单探测或双探测的各种组合计算能量量度的实施例。
[0130] 分析模块判断有1个还是4个麦克风(步骤230),并接着判断存在单探测还是双探测室内响应(步骤232用于单个麦克风且步骤234用于四面体麦克风)。此实施例对4个麦克风进行介绍,更普遍地,该方法可应用于任何多麦克风阵列。
[0131] 对单个麦克风以及单探测室内响应Hk而言,分析模块将每一频率槽k中的能量量度Ek(对频率的函数依赖性被忽略)构建为Ek=Hk*conj(Hk),其中,conj(*)是共轭运算符(步骤236)。能量量度Ek对应于声压。
[0132] 对于单个麦克风且双探测室内响应Hk及Hk,pe的情况,分析模块将在低频率槽kkt处,Ek=Hk*conj(Hk)(步骤240)。使用双探测的效果是衰弱能量量度中的低频噪声。
[0133] 对于四面体麦克风的情况,分析模块计算跨麦克风阵列的压力梯度,从该压力梯度可提取声速分量。如将要详细介绍的,对于低频率而言,基于声压和声速二者的能量量度可在更为宽广的收听区域中更具鲁棒性。
[0134] 对于四面体麦克风且单探测响应Hk的情况而言,在每一低频率槽kkt处的第二部分被计算为例如和的平方EK=|02 2 2
.25(Hk(m1)+Hk(m2)+Hk(m3)+Hk(m4))| 或平方的和EK=|0.25(|Hk(m1)|+|Hk(m2)|+|Hk(m3)|
2 2
+|Hk(m4)|)(步骤250)。
[0135] 对于四面体麦克风且双探测响应Hk及Hk,pe的情况来说,在每一低频率槽kkt处的第二部分可被计算为例如和的平方EK=|0.25(Hk(m1)+H
2 2 2 2 2
k(m2)+Hk(m3)+Hk(m4))| 或平方的和EK=|0.25(|Hk(m1)|+|Hk(m2)|+|Hk(m3)|+|Hk(m4)|)(步骤270)。双探测多麦克风的情况将根据声压及声速分量形成能量量度与使用预加重探测信号进行组合,以避免依赖于频率的缩放来提取声速分量,因此,在存在噪声的情况下,提供更具鲁棒性的声速。
[0136] 接下来是对于使用单探测或双探测技术的四面体麦克风阵列,用于构建能量量度、特别是能量量度的低频率分量的方法的更为精确的发展。此种发展示出双探测信号的使用以及多麦克风阵列的益处。
[0137] 在一实施例中,在低频率处,对室内声学能量密度的谱密度进行估算。在这一点上,瞬时声学能量密度由下式给出:
[0138]
[0139] 其中,用粗体标记的所有变量表示向量变量,p(r,t)及u(r,t)分别是由位置向量Ur决定的位置处的瞬时声压和声速向量,c是声速,且ρ是空气的平均密度。||||指示向量U的l2范数。如果分析是在频域中经由傅立叶变换进行的,则:
[0140]
[0141] 其中,
[0142] 位置r(rx,ry,rz)处的声速使用线性欧拉方程与压力相关,
[0143]
[0144] 且在频域中
[0145]
[0146] 项 是在频率w处沿x、y及z坐标的压力梯度的傅立叶变换。在下文中,所有分析将在频域中进行,且有关指示傅立叶变换的w的函数依赖性将像之前一样被忽略。类似地,有关位置向量r的函数依赖性将从符号中忽略。
[0147] 由此,在所希望的低频率区域中的各个频率处,所希望的能量量度的表达式可写作:
[0148]
[0149] 使用多个麦克风位置处的压力间的差异来计算压力梯度的技术已由Thomas,D.C.(2008)在Brigham Young University的硕士论文Theory and Estimation of Acoustic Intensity and Energy Density中介绍。给出了对于图1b所示四面体麦克风阵列以及特别选择的坐标系的情况下的这种压力梯度估算技术。假定所有麦克风是全向的,即麦克风信号表示在不同位置处的压力量度。
[0150] 压力梯度可根据麦克风被定位为使得压力场在由麦克风阵列所占据的体积上的空间变化小的假设而获得。这种假设将上边界置于可使用此假设的频率范围上。在这种情况下,压力梯度可通过 与任一麦克风对之间的压力差异近似地相关,其中,Pk是在麦克风k处测量的压力分量,rkl是从麦克风k指向麦克风l的向量,即 T表示矩阵转置算子,且﹒表示向量
T
点乘。对于特定的麦克风阵列以及特定的坐标系选择,麦克风位置向量为r1=[0 0 0],且 考
虑四面体阵列中所有的六种可能的麦克风对,借助最小二乘法,可对于压力梯度的未知分量(沿x,y及z坐标)求解超定方程组。特别地,如果所有方程以矩阵的形式成组,则获得下面的矩阵方程:
[0151]
[0152] 其中,T
[0153] P=[P12 P13 P14 P23 P24 P34],且Δ是估算误差。在最小平方意义上使估算误差最小化的压力梯度 被获得如下:
[0154]
[0155] 其中,(RTR)-1RT是矩阵R的左伪逆矩阵。矩阵R仅仅依赖于所选择的麦克风阵列几何形状以及坐标系的所选择的原点。只要麦克风的数量大于维度的数量,则其伪逆矩阵的存在是有保证的。为了估算3D空间(3维)中的压力梯度,需要至少4个麦克风。
[0156] 当谈到上述方法对压力梯度的实际寿命测量以及最终对声速的实际寿命测量的可应用性时,需要考虑几个问题:
[0157] ·该方法使用相位匹配的麦克风,然而,轻微相位不匹配对恒定频率的影响随着麦克风之间距离的增大而减小。
[0158] ·麦克风之间的最大距离受到这样的假设的限制:压力场中的空间变化在由麦克风阵列占据的体积上是较小的,这意味着麦克风之间的距离将远远小于所关注的最高频率的波长λ。Fahy,F.J.(1995)在Sound Intensity,2nd ed.London:E&FN Spon中已经建议,在使用有限差分逼近来估算压力梯度的方法中,麦克风间距应小于0.13λ,以防止压力梯度的误差大于5%。
[0159] ·考虑在现实测量中,噪声总是在麦克风信号中存在,特别是在低频率处,梯度变得含有很多噪声。对于同一麦克风间距而言,不同麦克风位置处由于来自扬声器的声波所致的压力差异在低频率处变得非常小。对于速度估算,考虑到所关注信号是低频率处两个麦克风之间的差异,有效信噪比与麦克风信号中的原始SNR相比减小。使情况甚至更糟的,在速度信号计算期间,这些麦克风差异信号被与频率成反比的函数加权,因而有效地导致噪声放大。这对其中基于间隔开的麦克风之间的压力差异的速度估算方法可被应用的频率区域施加了下边界。
[0160] ·室内校正应该在不能假设麦克风阵列中不同麦克风之间有大相位匹配的多种消费类AV设备中实现。因此,麦克风间距应尽可能地大。
[0161] 对于室内校正,关注的是在室内模式有主导影响的20Hz和500Hz之间的频率区域中获得基于压力以及速度的能量量度。因此,麦克风炭精盒之间的间距不超过大约9cm(0.13*340/500m)是适宜的。
[0162] 考虑压力麦克风k处及其傅立叶变换Pk(w)处的接收信号。考虑扬声器馈送信号S(w)(即探测信号)并用室内频率响应Hk(w)对探测信号从扬声器到麦克风k的发送进行特征化。于是,Pk(w)=S(w)Hk(w)+Nk(w),其中,Nk(w)是麦克风k处的噪声分量。为标记简化起见,以下方程中,对w的依赖性即Pk(w)将简写为Pk,等等。
[0163] 对于室内校正的目的,目标是找到可用于计算频率校正滤波器的代表性室内能量频谱。理想地,如果系统中没有噪声,则代表性室内能量频谱(RmES)可表示为:
[0164]
[0165] 在现实中,噪声将始终在系统中存在,且RmES的估算值可表示为:
[0166]
[0167] 在非常低的频率处,从扬声器到紧密间隔的麦克风炭精盒的频率响应之间的差的2
幅度的平方——即|Hk_Hl|——非常小。另一方面,不同麦克风中的噪声可被视为是不相关
2 2 2
的,且因此,|Nk-Nl| ~|Nk|+|N1|。这有效地减小所希望的信噪比,并使压力梯度在低频率处包含很多噪声。增加麦克风之间的距离将使所希望的信号(Hk-Hl)的幅度更大,并因此改进有效SNR。
[0168] 对于所有关注频率,频率加权因子 且其有效地以与频率成反比的比例放大噪声。这在 中引入朝向较低频率的向上倾斜。为了在估算能量量度中防止此低频率倾斜,将预加重探测信号用于低频率处的室内探测。特别地,预加重探测信号 此外,当从麦克风信号提取室内响应时,不用发送的探测信号Spe
而是用原始探测信号S进行解卷积。以这种方式提取的室内响应将具有下面的形式:
因此,能量量度的估算值的修改形式是:
[0169]
[0170] 为了观察其关于噪声放大的特性,将能量量度写作:
[0171]
[0172] 用此估算值,进入速度估算的噪声分量不以 被放大,且除此之外,进入压力估算的噪声分量以 被衰减,因此改进了压力麦克风的SNR。如前面所提到的,此低频率处理在从20Hz到大约500Hz的频率区域内应用。其目标是获得代表室内的宽广收听区域的能量量度。在较高的频率处,目标是对从扬声器到收听区域的直接路径以及少数早期反射进行特征化。这些特征主要依赖于扬声器构造及其在室内的位置,且因此在收听区域内的不同位置之间变化不大。因此,在高频率处,使用基于四面体麦克风信号的简单平均(或更为复杂的加权平均)的能量量度。结果得到的总室内能量量度被写作方程(12)。
[0173]
[0174] 这些方程与为单探测以及双探测四面体麦克风配置构建能量量度Ek的情况直接相关。特别地,方程8对应于用于计算Ek的低频率分量的步骤242。方程8中的第一项是平均频率响应的幅度的平方(步骤244),且第二项对压力梯度应用依赖于频率的加权以便估算速度分量并计算幅度的平方(步骤246)。方程12对应于步骤260(低频率)以及270(高频率)。方程12中的第一项是去加重的平均频率响应的幅度的平方(步骤264)。第二项是根据压力梯度估算的速度分量的幅度的平方。对于单探测及双探测这两种情况,低频率量度的声速分量直接根据测量得到的室内响应Hk或Hk,pe计算,估算压力梯度的步骤以及获得速度分量的步骤是一体化地执行的。
[0175] 子频带频率校正滤波器
[0176] 最小相位FIR子频带校正滤波器的构建基于每个频带的独立地使用先前所介绍的室内频谱(能量)量度的AR模型估算。由于分析/合成滤波器组是非临界采样的,所以每个频带可独立构建。
[0177] 现在参照图13及14a-14c,对于每个音频声道以及扬声器,提供声道目标曲线(步骤300)。如先前所介绍的,声道目标曲线可通过向室内频谱量度应用频率平滑、通过选择用户定义的目标曲线或通过将用户定义的目标曲线叠加到频率平滑后的室内频谱量度上来计算。此外,可对室内频谱量度施加限制,以防止对校正滤波器的极端要求(步骤302)。每一声道的中频带增益可被估算为中频带频率区域上的室内频谱量度的平均。室内频谱量度的偏移(excursion)被限制在中频带增益最大值加上上边界(例如,20dB)和中频带增益最小值减去下边界(例如,10dB)之间。上边界通常大于下边界,以避免将过多能量输送到室内频谱量度具有深零位的频带之中。将每一声道目标曲线与有边界的每一声道室内频谱量度合并,以获得聚集室内频谱量度303(步骤304)。在每个频率槽中,室内频谱量度被目标曲线的对应槽划分,以提供聚集室内频谱量度。子频带计数器sb被初始化为零(步骤306)。
[0178] 提取对应于不同子频带的聚集频谱量度的部分,并将之重新映射至基带,以便模拟分析滤波器组的下采样(步骤308)。聚集室内频谱量度303被分割为对应于过采样滤波器组中的每个频带的重叠频率区域310a、310b等等。每个分割根据分别应用于图14c及14b所示偶数及奇数滤波器组频带的抽取规则而被映射到基带。注意,分析滤波器的形状并不包括在映射内。这一点很重要,因为希望获得阶数尽可能低的校正滤波器。如果分析滤波器组滤波器被包括,则映射频谱将具有陡峭的下降缘。因此,校正滤波器将需要高阶,以便不必要地校正分析滤波器的形状。
[0179] 在映射到基带之后,对应于奇数或偶数的分割将使得频谱的部分平移然而某些其他部分还翻转。这可能导致频谱的不连续,其将需要更高阶的频率校正滤波器。为了防止校正滤波器阶数的不必要的增大,对翻转的频谱区域进行平滑。这又改变了平滑后区域中的频谱的精细细节。然而,应当注意的是,翻转的区间总是在合成滤波器已具有高衰减的区域中,且因此,这一部分的分割对最终频谱的贡献是可忽略的。
[0180] 对重新映射后的聚集室内频谱量度估算自动回归(AR)模型(步骤312)。室内频谱量度的每个分割在被映射至基带、模拟抽取效果之后,被解释为某种等效频谱。因此,其逆傅立叶变换将是对应的自相关序列。此自相关序列用作莱文逊-德宾算法的输入,该算法计算在最小二乘的意义上与给定能量频谱最佳地匹配的具有所希望阶数的AR模型。此AR模型(全极点)滤波器的分母是最小相位多项式。在对应的频率区域中,每个子频带中的频率校正滤波器长度由在整体室内能量量度产生期间所考虑的室内响应的长度粗略地决定(随着从低频率移动到高频率,长度成比例地下降)。然而,最终长度可凭经验精细调谐,或通过使用观察剩余功率并在达到希望的分辨率时停止的AR阶数选择算法来自动进行精细调谐。
[0181] AR的系数被映射到最小相位全零子频带校正滤波器的系数(步骤314)。此FIR滤波器将根据由AR模型获得的频谱的逆来进行频率校正。为了匹配不同频带之间的滤波器,对所有校正滤波器适当地进行归一化。
[0182] 子频带计数器sb递增(步骤316)并与子频带数量NSB进行比较(步骤318),以便为下一音频声道重复该过程或终止校正滤波器的按声道的构建。在这一点上,声道FIR滤波器系数可被调节为共同目标曲线(步骤320)。调节后的滤波器系数被存储在系统存储器中,并用于配置一个或多于一个的处理器以实现图3所示的用于每个音频声道的P个数字FIR子频带校正滤波器(步骤322)。
[0183] 附录A:扬声器定位
[0184] 对于全自动系统校准及设置,希望知道扬声器在室内存在的确切位置和数量。距离可基于从扬声器到麦克风阵列的估算传播延迟来计算。假定沿扬声器和麦克风阵列之间的直接路径传播的声波可由平面波近似,则相对于由麦克风阵列定义的坐标系原点的对应的到达角(AOA)、仰角可通过观察阵列内不同的麦克风信号之间的关系来估算。扬声器方位角及仰角根据估算的AOA来计算。
[0185] 有可能使用基于频域的AOA算法来确定AOA,原则上,该算法依赖于从扬声器到每个麦克风炭精盒的频率响应的每个槽中的相位之间的比率。然而,如Cobos,M.,Lopez,J.J.及Marti,A.(2010)在“On the Effects of Room Reverberation in3D DOA Estimation Using Tetrahedral Microphone Array”(AES128th Convention,London,UK,2010May22-25)中所示的,室内反射的存在对估算的AOA的准确性具有相当大的影响。可替代地,通过依赖于我们的直接路径延迟估算的准确性,将时域方法用于AOA估算,该准确性是通过使用与探测信号配对的分析包络方法而实现的。用四面体麦克风阵列来测量扬声器/室内响应允许我们估算从每一扬声器到每一麦克风炭精盒的直接路径延迟。通过比较这些延迟,可在3D空间中对扬声器进行定位。
[0186] 参照图lb,根据从扬声器传播到四面体麦克风阵列的声波的估算到达角(AOA)来确定方位角θ及仰角 。用于估算AOA的算法是基于向量点乘的属性的,以便对两个向量之间的角度进行特征化。特别地,在坐标系的特别选择的原点的情况下,下面的点乘方程可被写作:
[0187]
[0188] 其中,rlk表示连接麦克风k到麦克风l的向量,T表示矩阵/阵列转置运算,表示与平面声波到达方向对准的一元向量,c表示声速,Fs表示采样频率,tk表示声波到麦克风k的到达时间,且tl表示声波到麦克风l的到达时间。
[0189] 对于图lb所示的特定麦克风阵列,有 其中,r1=[0T
0 0], 且
[0190]
[0191] 收集所有麦克风对的方程,获得以下的矩阵方程,
[0192]
[0193] 此矩阵方程表示超定线性方程系统,该系统可通过最小二乘法来求解,从而产生下面的对于到达方向向量s的表达式
[0194]
[0195] 方位角及仰角根据归一化向量的估算坐标 得出为:以及 其中,arctan()是四象限反正切函数,且arcsin()是反正弦函数。
[0196] 使用时间延迟估算的AOA算法的可实现角度精度最终受到延迟估算的精度以及麦克风炭精盒之间间距的限制。炭精盒之间较小的间距意味着较小的可实现精度。麦克风炭精盒之间的间距最重要的是受到速度估算要求以及最终产品美感的限制。因此,所希望的角度精度通过调整延迟估算精度而实现。如果所需要的延迟估算精度变为采样间隔的一部分,则室内响应的分析包络在其对应的峰值附近被内插。在采样精度的一部分的情况下,新的峰值位置表示由AOA算法使用的新的延迟估算值。
[0197] 尽管已经示出和介绍了本发明的几个说明性实施例,本领域技术人员将会想到许多变型以及替代实施例。在不脱离如所附权利要求所限定的本发明的精神和范围的情况下,可想到并作出这类变型以及替代实施例。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈